Keelemudelitel põhinevad tehisintellekti assistendid on väga kiiresti laialdaselt kasutusele võetud. Üks paljudest keelemudelitest, mille vahel saab valida, on ChatGPT, mida kasutab iga kuu 180 miljonit inimest. Peale meelelahutuse on selliseid mudeleid hakatud rakendama määrava tähtsusega valdkondades, nagu juriidilised küsimused või tervishoiuteenused. Tehisarusüsteeme kasutatakse aktiivselt Eestiski, näiteks riigiasutustes koostatakse nende abil kirjade mustandeid ja dokumentide kokkuvõtteid. Ometi ei ole enamikul kasutajatel aimugi, mis toimub niisuguste süsteemide sees ja kuidas nad teevad otsuseid.
Vaatleme keelemudeleid lähemalt, saame teada, kuidas nad loovad meie küsimuse põhjal vastuse, ning tutvume uusimate võimalustega, mis aitavad keelemudeleid paremini mõista.
Tehisintellektist assistent ehk keelemudel
Tehisintellekti rakendused, mis võimaldavad kasutajal vabas vormis suhelda ja küsimusi küsida, on enamasti loodud samalaadsete keelemudelite põhjal. Nende aluseks on eriline arvutiprogramm, närvivõrkudel põhinev masinõppesüsteem, mis on treenitud kõigi eelnevate sõnade põhjal ennustama järgmist sõna. See ongi ainuke asi, mida need mudelid teevad: ennustavad ühe sõna haaval, üha uuesti ja uuesti. Näiteks, kui varem on kirjutatud:
Tudengid avasid ________
Sel juhul analüüsib keelemudel neid sõnu ja ennustab, et võimalik järgmine sõna võiks tõenäoliselt olla «oma». Seejärel koostatakse uus lause:
Tudengid avasid oma _________
Nagu näha, on viimati pakutud sõnast saanud konteksti osa, mille põhjal hakkab mudel ennustama juba uusi sõnu. Järgmiseks saab ennustada sõna «raamatud» ning protsessi muudkui korrata, kuni saame kokku terve lause:
Tudengid avasid oma raamatud ja hakkasid lugema.
Keelemudel on justkui rongijuht, kes laob enda ette rööpaid maha, ise samal ajal nende peal sõites. Iga järgnev sõna mõjutab lõplikku vastust ja kõiki tulevasi sõnu, mida see mudel ennustab. Mõnikord võib juhtuda, et keelemudel pakub vale või sobimatu sõna. Kui läheb hästi, suudab ta ülejäänud tekstiga oma vea parandada ja kasutaja ei pane midagi tähele. Ent mõnikord suudab üksainus väär sõna viia kogu ülejäänud pika teksti valele teele.
Tuleviku ennustamine matemaatika abil
Sisemiselt on keelemudelid nagu matemaatilised funktsioonid: võtavad olemasoleva informatsiooni sisendiks, teevad selle põhjal palju arvutusi ja siis esitavad väljundina oma ennustused. Oletame, et meie funktsioon on näiteks selline: