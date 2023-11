Meie grupp TurkuNLP on osa ühest sellisest projektist nimega HPLT ning me teeme selle projekti raames koostööd tehnoloogiaettevõtte Silo AI-ga.

Nende mudelite koolitamiseks mõeldud tekst pärineb peamiselt Internetist. Muidugi suhtleme ka Eesti teadlastega, kes on töötanud selle nimel, et luua keelemudeli jaoks kvaliteetseid andmekogusid ning proovivad neid andmeid kasutada tehisintellekti mudelite koolitamisel.

Kuigi mudeleid õpetatakse peamiselt Internetis avalikult kättesaadavate andmete põhjal, on oht, et needki tekstid sisaldavad privaatset teavet, mille mudel võib koolituse ajal meelde jätta ja vastuste loomisel korrata.

Sellise riski vastu rakendame me vastavaid tööriistu, et välja otsida ja varjata enne koolitust lähtetekstides sisalduvad võimalikud isikuandmed.

Teeme oma mudelid avalikuks, mis tähendab, et igaüks saab neid otse kasutada. Tööriistade avalikult kättesaadavaks tegemisega kaasneb muidugi alati oht, et kolmandad osapooled võivad neid väärkasutada, kuid me usume, et avatud Euroopa mudelitel on nii palju positiivseid külgi, mis kaaluvad üles võimalikud negatiivsed küljed.