• Keine Ergebnisse gefunden

Küsitluslehe tagasiside ja järeldused

4. PARTNERI ALGATATUD PARANDUSTE ANALÜÜS

4.2. Partneri algatatud parandused VOZ 2009 korpuses

4.2.5. Küsitluslehe tagasiside ja järeldused

Jakob Nielsen (1993) rõhutab oma raamatus, et süsteemi kasutaja tundmine ja tagasiside arvutikasutajatelt on ülioluline. Ta tutvustab mitmeid hüüdlauseid, millest esimesega „Sinu parim arvamus ei ole piisavalt hea“54 (Nielsen 1993: 10) viitab, et võimatu on luua kasutusväärtuslikku55 kasutajaliidest, tuginedes üksnes looja parimale arusaamisele, milline see peaks välja nägema. Kasutajad võivad käituda tohutult omanäolisel ja ootamatul viisil võrreldes sellega, missugune on kasutajaliidese looja nägemus. Sellest Nielseni järeldusest võib tõmmata paral-leele vestlusanalüütikute varem tutvustatud tõdemusega, et tuleb uurida salves-tatud teksti, kuna me ei suuda ette kujutada, kuidas täpselt inimesed räägivad.

Just seetõttu on kasutajate tagasisidel oluline väärtus ning seepärast tutvus-tatakse siin küsitluslehtede kaudu saadud tagasisidet aastatel 2001 ja 2009 toimunud simuleeritud DS-ide kasutajaliidestele.

VOZ-i esimeses eksperimendis (Kullasaar 2001; Valdisoo, Vutt 2002) kasu-tati katseisikutelt tagasiside saamiseks küsitluslehte 14 küsimusega, millest 2009. aasta eksperimendiseeria küsitluslehele on üle võetud 12 esimest küsimust

54 „Your Best Guess Is Not Good Enough“.

55 “Kasutusväärtus näitab, kui hõlpsasti mingi tööriist, tarkvara, veebisait vms on kasutatav soovitava tulemuse saavutamiseks.” ja “Standard ISO 9241-11 defineerib kasutusväärtust järgmiselt: kasutusväärtus näitab, mil määral kindlaksmääratud kasutajad saavad toodet kasutada kindlaksmääratud eesmärkide saavutamiseks efektiivselt, tulemuslikult ja rahuldustpakkuvalt kindlaksmääratud kasutuskontekstis. Standard selgitab ka kasutus-väärtuse mõõtmise põhimõtteid” (http://www.vallaste.ee, päring ‘usability’; 17.01.2016).

(see võimaldab soovi korral vastuseid võrrelda; vt küsimused 1–12, lisa 1) ning juurde on lisatud 9 küsimust (küsimused 13–21, lisa 1). Küsitluslehele vastas 31 katseisikut, ehkki mõnel juhul ei vastatud kõigile küsimustele. Ülejäänud 4 andsid vaid nõusoleku kasutada eksperimendi salvestatud dialooge. Küsitlus-lehe täitjate hulgas oli 22 meest (küsitlusKüsitlus-lehe täitmise ajal vanusevahemikus 18–52 eluaastat) ja 9 naist (20–51 eluaastat).

Küsimused 1–5, 7–9, 13, 14, 16–21 puudutavad konkreetset dialoogi või dia-looge, milles katseisik osales, teised küsimused on aga üldisemat laadi (6, 10–

12, 15, 17).

Alljärgnev on käesoleva väitekirja autori kokkuvõte küsitluslehele antud vastustest (vt ka Pärkson 2011), kusjuures vastustest kokkuvõtte tegemisel on võimalikult palju kasutatud neid (omadus)sõnu, mida inimesed ise tagasisidet andes tarvitasid.

19 vastanut ei arvanud kordagi, et temaga suhtleb inimene, mitte arvuti. 2 katseisikut üldiselt ei aimanud võltsingut, kuigi trükiviga tekitas neis korraks kahtlust. 2 vastanul tekkis kahtlus, sest nad olid kuulnud-lugenud sellisest eksperimendist. 1 katsealune avastas võltsingu vestluse lõpus, kuna Võluriks oli tema sõber, kes reetis end sõpradevahelise naljaga, millest arvutiprogramm ei oleks tohtinud aru saada. Kahtlusi tekitas samuti DS-i aeglus, kohmakus, intelli-gentsus või muud nüansid, mida ei osatud sõnastada.

Küsimused 3–6 käivad keelekasutuse kohta. DS-iga suheldes ei kasutanud 12 inimest enda hinnangul kordagi lihtsamat keelt. 15 inimest arvasid, et nad kasutasid lihtsamat või lakoonilisemat, hästi struktureeritud või ühemõttelist keelt. 4 inimest kasutasid mõnikord lihtsamat keelt, ent mitte igakord. Samuti püüti tarvitada korrektsemat keelt, kontrolliti, et ei esineks kirjavigu. 15 inimest vormistasid meelega lühikesi lauseid, 11 inimest lihtlauseid, 11 inimest valisid ka lihtsama sõnastuse (sõnavara), 8 inimest vältis voorudes võõrsõnu ja 1 ini-mene eelistas võõrsõnu, et arvutiprogramm paremini aru saaks. Katseisikute hinnangul oli DS-i sõnavara oluliselt väiksem/piiratud, kui seda oleks inimesel.

Eksperimendis osalenute hinnangul tarvitas DS standardiseeritud keelt, lause-malle, kordas samu väljendeid, kasutas lihtlauseid. Mõne meelest oli keel puine või tehislik. Samuti arvati, et DS-i ametniku tekstis esines vähem tegusõnu, kui inimene kasutaks. Ligi pooled vastanutest (14) leidsid, et DS ei kasutanud lihtsamat keelt – vähemalt ei häirinud see neid. Katseisikud kinnitasid küsi-muses 6 nimetatud keeleliste probleemide olemasolu. Nad arvasid, et Aivo-sarnastel programmidel võib tekkida mitmeid keelelisi probleeme: kitsas sõnavara (20), keerulised laused (20), kasutaja tehtavad trükivead (18), kääna-mine ja pöörakääna-mine (17), asesõnad (13). Lisaks peljati, et arvutile võib üle jõu käia släng ja poolikud laused. Nende arvamuste tõelevastavust saab kontrollida alles tegelike DS-ide tööd analüüsides. 6 inimest olid kindlad, et said oma küsimus(t)ele ammendava(d) vastuse(d). 16 inimest said enamikule küsimustest rahuldavad vastused, kuid mingis osas oleksid nad soovinud enamat. 9 inimest ei saanud oma küsimus(t)ele ammendavat/vaid vastust/seid. Heideti ette vas-tuste üheülbalisust/piiratust, vastamise aeglust, oskamatust öelda näiteks filmide

ingliskeelseid nimesid ning vastata mõnedele täpsustavatele küsimustele. Samuti häirisid kasutajaid teemade piiratusest tulenevad vastuste mittesaamised ehk siis asjaolu, et ametnik ei vastanud teemavälistele küsimustele.

Katseisikud arvasid üldiselt, et DS vastas teistmoodi, kui oleks vastanud inimene. Seejuures ei olnud erinevus teksti sisus, vaid teksti esitusviisis. DS-i genereeritud voorud mõjusid nende hinnangul puiselt/kunstlikult/formaalselt/

tehislikult/faktipõhiselt, olid kinni kitsalt ühes ainevaldkonnas. Leiti, et inimene oleks vastustesse pannud rohkem emotsioone, olnud väljendusrikkam ning andnud omapoolseid soovitusi (soovituste andmist peeti eetilistel kaalutlustel Võluritele mittesoovitavaks).

Küsimus 17 koosneb kolmest alaküsimusest, millest kaks esimest on üldist laadi, kolmas konkreetset eksperimenti silmas pidav. Vastustest selgus, et tunti tugevat võõristust kindlate lausemallide suhtes. Selle põhjal võib kinnitada, et üks esmane võti loomuliku keelekasutamise saavutamiseks on DS-i varieeru-vam keelekasutus. 19 inimest sooviksid infot hankida sellise DS-i abil nagu DS Aivo. Lisaks oleksid 7 inimest mõnikord või mõnede tingimuste olemasolul (nt kiirem süsteem, kvaliteetsem süsteem kui hetkel) sellisest teabehankeviisist huvitatud. Ainult 5 inimest (kõik mehed) kirjutasid, et eelistavad ise infot otsida või vastupidi suhelda inimesega; üks neist väitis, et praegune viis on liiga keeruline.

Võrdluseks olgu toodud Alan Newelli ja tema kolleegide suuliste Võlur Ozi ekeperimentide tagasiside, mille järgi eksperimendis osalenutele ei avaldanud Newelli (1991: 34) hinnangul süsteem erilist muljet, kusjuures saadi väga erine-vat tagasisidet alates sellest, et ei soovita sellist rakendust enam mitte kunagi kasutada (never use one again) kuni väga positiivse tagasisideni, mille järgi inimene kasutaks alati sellist süsteemi, kui see oleks võimalik (would always use one if it was available). VOZ 2009 eksperimentide tagasiside, nagu eelpool esitatud numbrid näitavad, oli tunduvalt positiivsem.

Reaalset DS-i saaks katseisikute arvates paremaks muuta eelkõige vastamise kiirust tõstes, lisaks peaks süsteem omama suuremat sõnavara ja andmebaasi ning olema paindlikum ja omama õpivõimet. Pakuti, et infole lisaks võiksid olla ka hüperlingid ja teemaga seotud disain (nt ilmateadete info jagamise puhul kaart, pilved, vihm, päike). Küsimusele number 12 vastates leiti, et vabas vormis on mugavam küsimusi esitada, kuid samas kardetakse, et arvutiprogramm saab sel juhul valesti aru ning saadakse valeinformatsiooni. See on põhiline korduvalt nimetatud põhjus, miks katseisikud eelistaksid ekraanile ilmuvatest menüüdest valikuid teha. Teine põhjus on juba kujunenud harjumus menüüde abil teavet otsida. Kuigi küsitluslehel puudus küsimus DS-i kiiruse kohta, mai-nisid erinevate küsimuste vastustes DS-i aeglust peaaegu kõik osalejad. Info hankimise kiirus on ülimalt oluline tegur. Mõned arvasid, et kiirem on DS-ilt vastuseid saada, teised usuvad, et menüüdest otsimisega võidab aega. Mõned peavad DS-i põnevaks, iseäranis põnev olevat võimalus arvutit proovile panna.

Menüüdest valikute tegemise eelistamine on seotud kartusega saada arvutilt vabas vormis vesteldes valeinformatsiooni. Kõik DS-i eelistajad peavad seda

mugavamaks infootsimise vormiks. Arvati ka, et mõlema kombinatsioon oleks hea lahendus. Katseisikuid ei häirinud „arvuti“ keelekasutuses otseselt midagi, kuid eelistused arvutiprogrammi keelekasutusele on paljudel olemas (küsimused 13–14). Korduvad lausemallid ei ole kasutajale meelepärased. Rohkem vasta-nuid leidis, et DS-i ametnik peaks alustama oma vooru suure algustähega (7 inimest), kasutama lauselõpumärke (7), järgima igati eesti kirjakeelereegleid (7), kasutama varieeruvat keelt (9). Lausemalle pidas vajalikuks 2 vastajat. DS-i kujunduse juures (küsimus 15) peab enamik vastanutest mõne visuaalse lisa olemasolu heaks mõtteks. Näiteks soovitatakse kinoinfo puhul kõige enam hinnatabelit, aga samuti kino asukoha kaarti, asjakohaseid veebilinke. Soovitati ka süsteemi tutvustavat lisa. Kinoinfo DS-i puhul oodati nt hittfilme tutvus-tavaid videoklippe. Samas arvas 1 vastaja, et liigne visuaalsete lisade olemasolu kaotab sellise DS-i mõttekuse ning näiteks hinnatabelil on väärtus vaid juhul, kui valikuid on rohkem kui 4. Vastanutest 7 kinnitasid, et praegune kujundus on igati hea ning millegi lisamiseks või eemaldamiseks puudub vajadus. Animeeri-tud nägu meeldis 11 vastanule, 7 inimest jättis see ükskõikseks ja 13 vastanutest animeeritud nägu ei meeldinud. Ühte inimest häiris Aivo animatsioon nii palju, et ta väljendas seda mitmete erinevate küsimuste vastustes. Sünteeshäälele kes-kendus küsimus nr 17. Vastustest selgus, et 16 sellele küsimusele vastanutest ei lülitanud sünteeshäält sisse ja 7 katseisikut lülitas sünteeshääle sisse. 2 katse-isikut lülitasid tehishääle sisse vaid prooviks. 10 vastanut väitsid, et selline rakendus on kasutu, 6 vastanut pidas seda vajalikuks ja 1 ei osanud sellele küsimusele vastata. 3 inimest ei proovinud sünteeshäält kas tehnilistel (ei olnud kõlareid, rakendus väidetavalt ei töötanud) või muudel põhjustel (katseisik viibis avalikus kohas, nt rongis). Arusaam sünteeshääle vajalikkusest ja tegelik hääle sisselülitamine ei olnud alati vastavuses. 5 katseisikut, kes pidasid sün-teeshäält küll vajalikuks, ei lülitanud seda ometigi sisse. Põhjuseks oli enamasti see, et vajalikuks peeti seda mõnele teisele ühiskonnagrupile (nt vaegnägijad või muud erivajadustega inimesed; ka noored, kellele see lihtsalt meeldiks).

1 hääle sisselülitanud vastanu mainis, et teda häiris tehishääle monotoonne kõla, 1 katseisiku jaoks oli see just huvitav. Kokkuvõtvalt, sünteeshääle olemasolu DS-is on hea vaid valiku võimalusena, automaatsena võib see olla pigem häiriv.

Vajalikkust enda jaoks katseisikud ei märkinud, kuid siiski leiti, et on inimesi, kellele see süsteemi funktsioon on äärmiselt vajalik. Küsimused, millele küsit-luslehe täitjad ei saanud vastust ja mis neile olid meelde jäänud, olid sageli ebastandardsed küsimused (nt Millal tuleb nii soe ilm, et päevitada saab?, Kas Cinamonis on mugavad toolid?, Millal Kate Beckinsale üldse kuulsaks sai?) või n-ö naljaküsimused (nt Aivo neiupõlve nimi) ehk muud Aivot puudutavad küsimused, aga ka tavaküsimused (nt filmide originaalkeelsed nimed). See, kas

„arvuti“ oskas uusi küsimusi seostada eelnevate vastustega, oli kindlasti eks-perimenditi erinev ning olenes iga konkreetse Võluri otsusest ja seetõttu lahk-nevad vastusedki. Kuid huvitav oli, et märkimisväärne osa küsitluslehe täitjatest ei osanud sellele küsimusele vastata (ei meenunud, ei pannud seda tähele, ei märganud, ei katsetanud süsteemi piisavalt jne). Eksperimendis esinenud „arvuti“

aktiivsuse-passiivsuse suhtega oli igati rahul 14 vastajat. 11 inimest leidsid süsteemi olevat olnud passiivse, mõnele see meeldis, mõnda häiris. 6 katseisikut arvasid süsteemi olevat pigem aktiivse, mõnele see meeldis, mõnele mitte.

Viimase küsimuse number 21 järgi häiris DS-i juures vastajaid kõige enam aeglus, mis oli eksperimendist tingitud eripära. Samuti häirisid paljusid lause-mallid. Seda fakti on reaalse DS-i loomisel oluline teada.

Korraldatud eksperimendid on tähtsad vähemalt kahes mõttes. Esiteks, kogutud materjal (dialoogid, ent mitte info dialoogis osalejate kohta) eksisteerib dialoogikorpuse näol, mis võimaldab seda materjali ka teistel uurijatel ana-lüüsida või võrrelda mõne muu korpusega. Teiseks on saadud kogemus ja tead-mised, kuidas sama eksperimenti edaspidi veelgi edukamalt läbi viia. Näiteks küsimustiku katseisikute vastustel põhinev analüüs tegi selgeks, et mõned küsimused on üleliigsed (seda näitasid vastuste kordamised teatud konkreetsete küsimuste puhul), mõnede küsimuste vastused ei kanna rakendamise mõttes olulist informatsiooni (nt süsteemi initsiatiivikust puudutav küsimus) ning esimene küsimus peaks objektiivsemate vastuste saamiseks asuma küsimustiku lõpus. Sellised probleemid ei tekkinud mitte hooletult valmistatud küsimus-tikust; vastupidi, küsimustik oli pikka aega ja hoolikalt läbi mõeldud ja mitmete inimestega konsulteeritud. Ometigi oli inimestel, kes teadsid eksperimendi ole-must, raske panna end katseisiku rolli ja vaadata neid küsimusi katseisiku vaatevinklist. Edaspidiste eksperimentide läbiviimise sujuvuse tõstmiseks pidas dissertatsiooni autor oluliseks muuta küsimustikku (vt lisa 4). Ja neid muudetud küsimustikke on ka hilisemates, 2012. aasta eksperimentides kasutatud.