Tehisintellekti kiirest arengust innustatult katsetame Eesti Keele Instituudis, kuidas saaksime tehisintellekti ehk suuri keelemudeleid kasutada sõnastike koostamisel. Räägin sellest, kui hästi oskavad suured keelemudelid praegu eesti keele sõnade tähendusi seletada. Katseks valisime välja sõnad ja lasime mudelitel teha neile seletused. Seejärel hindasid mudelite pakutud seletusi Eesti Keele Instituudi sõnaraamatukoostajad.
Tehisintellekti tugevusena tõid hindajad välja seletuste põhjalikkust, detailsust ja ladusat sõnastust. Oma töö jaoks väga kasulikuks või mõnevõrra kasulikuks hindasid sõnaraamatukoostajad lausa 83% pakutud seletustest. Kiideti ka keelemudelite pakutud tähendusi ja näiteid, mida sõnastikus esitatud ei olnud. Uued pakkumised võisid aga olla nii tugevus kui ka nõrkus, olenevalt sellest, kas nad hilisemal kontrollil osutusid õigeks või mitte. Lisatähendus võis olla sõnastikus kirjeldamata tähendus, mida päriselt kasutatakse, näiteks pakkus mudel sõnale maruhoog emotsionaalse purske tähendust, kuid lisatähendus võis olla ka mudeli enda leiutis, mis lugejat eksitab, näiteks sõna sardiinlane kirjeldus, mis väitis, et sõna viitab tihedalt koos olevatele inimestele, sarnaselt sardiinidele konservikarbis. Sama kehtis ka pakutud näidete kohta, mis võisid olla pädevad või siis mitte, nt sõna salk näited: "Ta lõikas juustest väikse salgu" – igati loomulik lause – aga pakutud sõnapaarid salk lilli ja salk võtmeid mõjuvad ebaloomulikult.
Üks põhilisi kitsaskohti töös keelemudelitega ongi see, et nende väited vajavad täiendavat kontrolli ja valeväited võivad vahel olla raskesti tuvastatavad. Uute pakkumiste eelis on jällegi see, et sõnaraamatukoostaja võib keelemudelitelt saada väärtuslikke ideid nii tähenduste kui ka näitelausete lisamiseks sõnastikku. Kokkuvõtvalt võib siiski öelda, et tulemused olid head ja praegu saavad mudelid pakkuda põhja, mida tuleb sõnaraamatukoostajal kontrollida ja kohandada, kuid mis on koostamisel juba märkimisväärselt abiks.
Kommentaarid
Alates 02.04.2020 kuvab ERR kommenteerija täisnime.