ÜLESKUTSE ⟩ Aita tehisintellekt eesti keelt rääkima panna

teadus.postimees.ee
Copy
Illustratsioon.
Illustratsioon. Foto: Cai Yang via www.imago-images.de

Oleme seni harjunud kasutama kõnetehnoloogia lahendusi inglise keeles, kuid ei ole kaugel aeg, kui saame pöörduda oma telefoni, nutikella või auto poole oma emakeeles. Ent selleks tuleb talle enne eesti keel selgeks õpetada.

Projekt «Anneta kõnet» kutsub kõiki eesti keelt kõnelevaid inimesi enda juttu teadusele annetama, et panustada seeläbi eesti keele säilimisse ning kõnetehnoloogia lahenduste kiiremasse jõudmisse meie igapäevaellu.

«Tänasel emakeelepäeval on oluline meeles pidada, et eesti keele rääkijaid on maailmas vaid veidi üle miljoni ning me kõik saame kaasa aidata sellele, et meie emakeel säiliks ning oleks elujõuline ka tulevikus. Just seetõttu on vaja arendada edasi eestikeelse kõnetehnoloogia lahendusi, et saaksime oma nutiseadmetega tulevikus inglise keele asemele just eesti keeles suhelda,» märkis Riigi Infosüsteemi Ameti (RIA) masinõppe- ja keeletehnoloogia osakonna juht Kaupo Laagriküll.

Möödunud aasta septembris alanud kõnekogumisprojekti kaudu on seni kogutud juba 88 tunni jagu ehk ligi 1200 erinevat kõneannetust. Annetuste keskmine pikkus on ca 5 minutit ning kõige aktiivsemad annetajad on olnud 25–34-aastased, kellele järgnevad 18–24-aastased. «Võib öelda, et naised on meestest mõnevõrra aktiivsemalt üleskutsega kaasa läinud, kuna ligi 2/3 kõigist kõneloovutajatest on olnud naised,» lisas Laagriküll.

Enda kõnet saab annetada veel kuni aprilli lõpuni. Seda saab teha nii arvuti, nutitelefoni kui ka tahvelarvuti vahendusel ja see on väga lihtne. Kõne annetamiseks tuleb minna veebiadressile https://annetakõnet.ee/, valida sealt endale huvitav teema ning asuda rääkima. Oma kõnet on oodatud annetama nii eesti keelt emakeelena, eesti keelt võõrkeelena kui ka erinevaid eesti murdekeeli kõnelevad inimesed. Mida rohkem kõnematerjali koguneb, seda rohkem kasu sellest on.

Kuigi häälabiliste sünonüümideks on saanud märksõnad «Ok, Google» ja «Hey, Siri», kasutatakse kõnetuvastuse lahendusi juba väga erinevates valdkondades. Näiteks Põhja-Eesti regionaalhaigla radioloogia osakonnas uuringuaruannete koostamiseks, riigikogus ja kohtutes istungite stenografeerimiseks ning meediamonitooringufirmades, et kirjutada üles raadio- ja telesaadetes kõneldu. Kõnetuvastus on tähtis abivahend ka ligipääsetavuse parendamiseks vaegkuuljatele.

Projekti tulemitest saab laiemat kasu kogu Eesti ühiskond, sest kõnetehnoloogia lahenduste abil on võimalik muuta nii riigi- ja erasektoriga suhtlemist kui ka teenuste kasutamist inimeste jaoks lihtsamaks ning kiiremaks.

Kogutud kõnematerjali saavad oma töös kasutada nii teadusasutused eesti keele uurimiseks kui ka era- ja avaliku sektori organisatsioonid olemasolevate teenuste parandamiseks või uute loomiseks. Annetatud kõnematerjal transkribeeritakse ehk viiakse tekstilisele kujule. Kogutud kõnematerjal ja sellele vastavad tekstilised materjalid saavad kõigile kättesaadavaks avaandmetena veebiaadressil https://avaandmed.eesti.ee.

Mittetulundusliku kampaania «Anneta kõnet» kutsus ellu majandus- ja kommunikatsiooniministeerium koostöös Riigi Infosüsteemi Ametiga. Ühine eesmärk on koguda spontaanset eestikeelset kõnet eesti kõnetehnoloogia lahenduste – kõnetuvastus ja häälkäsklused – edasiarendamiseks. Projekti rahastab Euroopa Liit – NextGenerationEU.

Kommentaarid
Copy
Tagasi üles