Sõnaraamatu formaat nõuab konkreetsete otsuste tegemist, aga vahel – ja vahest päris tihti – on otsuseid keerukas vastu võtta. No mida teha sõnadega nagu ohmu ja tobuke? Või käpard ja krihvel? Aga kaagatama ja kraaksuma? Sõna üle ei saa muidugi niisama üldse otsustada, vaja on teada konkreetset tähendust. Aga sellestki ei piisa, sest laused, ümbrused, kontekstid, situatsioonid… kõik sõltub ja erineb – rääkimata sellest, kuidas eri inimesed sõnu tajuvad. Näiteks selles, kas mõnd sõna on nüüd kasutatud üksnes kõnekeelselt või siiski halvustavalt, lähevad inimeste tajud lahku olenemata sellest, kuidas ütleja või kirjutaja seda mõelnud on. Samuti võib mõni sõna tunduda ühele täiesti neutraalne, aga teisele halvustav.
Selleks aga, et sõnaraamatukoostajal oleks keerukates olukordades lihtsam otsuseid vastu võtta, katsetasimegi taaskord suuri keelemudeleid. Lasime neil analüüsida keelekorpuse materjali.[1] Katse mõte oli võrrelda Claude'i, Geminit ja GPT-d (aprill 2026 alguse seisuga uusimaid versioone) just halvustava, kõnekeelse ja neutraalse kasutuse eristamises.[2] Lõime selleks viie inimese hinnangutest koosneva võrdlusandmestiku. Niisiis pidid inimesed ja mudelid tegema samade sõnade (nende konkreetsete tähenduste) kohta samade korpuslausete alusel valikuid.
Tulemused näitasid, et inimeste ja mudelite vastused kattusid täielikult 61–71%-l juhtudest. Kontrollisime üle, et ehk sobinuks ka need vastused, kus mudelid pakkusid midagi muud, kui sai inimeste koondarvamuseks. Näiteks kui kellegi tüütult õiendavat väljendusviisi kirjeldatakse sõnaga kaagatama, saab see olenevalt olukorrast olla kas kõnekeelne või halvustav – siin valisidki ühed inimesed ühe, teised teise ning samamoodi lahknesid mudelite pakkumised.
Vastuseid, mis sõnaraamatukoostajale kindlasti ei oleks sobinud, andsid eri mudelid 11–20%.[3] See teeb, et edukaima mudeli vastused sobinuks sõnaraamatus esitamiseks 88,5%-l juhtudest. Seekordses katses osutus edukaimaks Gemini 3.1 Pro.
Kokkuvõtteks tõden hoopis seda, et sõnatähendustele EKI ühendsõnastikus registrimärgendi määramine on üks keerukas töö. Lõppeks tuleb keelekasutajal valik teha ikkagi enda olukorra, mitte sõnaraamatu järgi, sest see saab ainult osutada suundumustele, mitte olla igas olukorras otsustajaks.
[1] Kõigepealt kasutasime Claude Haiku 4.5 abi, et sõeluda korpuse mahukate andmete seast välja laused, kus meie katses osalevad sõnad esinesid oma konkreetses tähenduses. Ligi 300 sõna puhul kulunuks inimesel selleks nädalaid, mudel aga sai hakkama 3–4 tunniga. Kvaliteet on küll teine asi, mõni lause ei kõlvanud näiteks kuhugi, aga paari tunniga uued laused pakkuda on mudeliga siiski kiirem, kui läheks inimesel esimeste valikutegagi. Seega: ajavõit materjali kokkukogumisel.
[2] Claude'i, Gemini ja GPT varasemad versioonid on end meie eelmistes katsetes eesti keele kategoriseerimisülesannetega juba tõestanud (vt nt ERÜ aastaraamatus ilmunud artiklit).
[3] Näiteks sõna muld esines otsitava tähenduse '(väga vana inimese, rauga kohta)' asemel korpuselausetes 'maakoore kobeda pinna' tähenduses ja seega olid inimesed öelnud, et selle tähenduse kohta ei saa otsust vastu võtta, ent mudelid proovisid ikka mingi valiku teha.
Vaata ka Lydia Risbergi jt ettekannet "Registrisegadus sõnaraamatu sünonüümipesades. Kas suured keelemudelid on lahendus?" (Eesti Rakenduslingvistika Ühingu kevadkonverents, 23.04.2026).






































Kommentaarid
Alates 02.04.2020 kuvab ERR kommenteerija täisnime.