Meie grupp TurkuNLP on osa ühest sellisest projektist HPLT ning me teeme selle projekti raames koostööd tehnoloogiaettevõttega Silo AI.
Millist infobaasi kasutatakse eesti keele kohta?
Nende mudelite koolitamiseks mõeldud tekst pärineb peamiselt Internetist. Muidugi suhtleme ka Eesti teadlastega, kes on töötanud selle nimel, et luua keelemudeli jaoks kvaliteetseid andmekogusid ning proovivad neid andmeid kasutada tehisintellekti mudelite koolitamisel.
Millist koostööd tehakse, et edendada tehisintellekti kasutamise kirjaoskust ja vastutustundlikku kasutamist?
Projekti eesmärk on luua nii-öelda vundamendimudelid, mille alusel saab loodetavasti ehitada edasi Euroopa tehisintellekti süsteeme.
Soovitame nende mudelite vastutustundlikku kasutamist, hinnates näiteks nende kalduvust tekitada mürgist või kallutatud teksti, ning soovitame dokumenteerida üksikasjalikult nii nende baasmudelite piirangud kui ka võimalikud riskid.
Kuidas tagatakse ende avatud mudelite väljatöötamisega andmete turvalisus ja privaatsus, arvestades näiteks Euroopa GDPRi ja muid privaatsusregulatsioone?
Kuigi mudeleid õpetatakse peamiselt Internetis avalikult kättesaadavate andmete põhjal, on oht, et needki tekstid sisaldavad privaatset teavet, mille mudel võib koolituse ajal meelde jätta ja vastuste loomisel korrata.
Sellise riski vastu rakendame vastavaid tööriistu, et välja otsida ja varjata enne koolitust lähtetekstides sisalduvad võimalikud isikuandmed.
Kas algatus käsitleb ka eetilisi probleeme, mis võivad tekkida tehisintellekti väärkasutamisest?
Anname selles osas endast parima, et vähendada meie loodud vundamendimudelite võimalikke negatiivseid kasutusi.
Teeme oma mudelid avalikuks, mis tähendab, et igaüks saab neid otse kasutada. Tööriistade avalikult kättesaadavaks tegemisega kaasneb muidugi alati oht, et kolmandad osapooled võivad neid väärkasutada, kuid me usume, et avatud Euroopa mudelitel on palju positiivseid külgi, mis kaaluvad üles võimalikud negatiivsed küljed.