Inimaru tehisaru ajastul (1)

9. veebruar 2024, 14:25

Tehisarusüsteemi ChatGPT-4 pildigeneraatori Dall-E3 tehtud pilt, mis kujutab seda, kuidas tehisarusse on kogutud palju maailma teadmisi. Foto: JAAN ARU / TEHISARU

Tagasihoidlikult väljendudes on tänapäeva tehisaru üsna võimas: mida muud öelda algoritmide kohta, mis suudavad disainida paremini kui disainerid ja kirjutada esseid paremini kui mõni professor. Kui keegi selles kahtleb, võib ta proovida programme Dall-E3 ja ChatGPT. Meie ülikoolide professorid, kaasa arvatud siinse artikli autor, suudaksid küll kirjutada paremaid esseid oma teemadel (mina näiteks tehisarust, teadvusest, loovusest, ajust jne), aga ChatGPT suudab seda teha mis tahes teemal.

Tundub loomulik lugeda seda teksti Horisondi veergudelt, aga umbes kümme tuhat aastat tagasi ei olnud kirjakeelt, veel paarsada aastat tagasi ei olnud trükipressi, paarikümne aasta eest ei olnud internetti. Kõik need võimalused on tekkinud seetõttu, et inimene on väga arukas loomaliik. Tehisaru ehk tehisintellekti või tehismõistuse uuringute põhieesmärk on seda arukust masinates järele teha. Tehisaru üritab tehislikult, näiteks arvutites, jäljendada loomulikku mõistust ja täita ülesandeid, mida seostatakse inimmõistusega, näiteks võimega arutleda ja õppida. Idee tehisarust ei ole sugugi uus. Tehisaru üle hakati mõtlema juba 1950. aastatel. Toona oldi väga optimistlikud. „Kahekümne aasta pärast on masinad võimelised tegema iga tööd, mida inimene teeb,“ arvas Nobeli auhinnaga pärjatud Herbert Simon aastal 1965. Seega käis ennustus aasta 1985 kohta. Peaaegu nelikümmend aastat hiljem, aastal 2024, ei ole masinad endiselt võimelised tegema iga tööd. Ilmneb, et kui asi puutub tehisarusse, võib tarkade inimeste intuitsioon eksida. Muu hulgas selles, missugused tööd on ohus. Veel mõni aeg tagasi võis ennustada, et esmalt võtab tehisaru üle lihtsamad tööd, kuid nüüd on vastupidi: praegusaja tehisaru ähvardab programmeeriaid, disainereid ja turustustekstide loojaid. Allpool selgub, miks see just nii on.

Tehisaru üritab tehislikult, näiteks arvutites, jäljendada loomulikku mõistust ja täita ülesandeid, mida seostatakse inimmõistusega, näiteks võimega arutleda ja õppida.

Üldse tundub, et tehisaru kohta on raske ennustusi teha. Näiteks 1970. aastate lõpus arvati, et kui kunagi tekivad masinad, mis võidavad inimest males, siis ei ole need masinad, mis mängivad ainult malet, vaid pigem masinad, millel on üldine mõtlemisoskus. Ka see arvamus oli vale. Vähem kui kakskümmend aastat hiljem võitis Deep Blue male suurmeistrit Garri Kasparovit males. Aga Deep Blue ei olnud sugugi näide üldise intelligentsi kohta. Ta mängis ainult malet. Iseseisvalt, ilma ümberprogrammeerimiseta, ei oleks Deep Blue hakkama saanud isegi trips-traps-trulliga. Malealgoritmid võidavad meid internetis, aga meie suudame ka endale võileiba teha, rullida Horisondi kokku, et sellega kärbest maha lüüa, vastata küsimustele kultuuriloost, arutleda päevapoliitika üle, saada aru inimeste emotsioonidest või ära tunda inimesi nende nägude järgi.

Inimaru ei ole hämmastav seetõttu, et ta suudab malet mängida või kuuekäigulist õhtusööki valmistada või korvpallimängust aru saada. Inimaru on hämmastav, kuna vajaduse korral suudab ta kõike seda ja veel paljut muudki. Meie arukus ei väljendu ühe ülesande edukas lahendamises (ega IQ-testis). Nii et kui teete endale vorstivõileiba või paberlennukit, siis tundke ennast uhkelt. Ja kui keegi räägib (või kirjutab Horisondis), et tema teab, mis tehisaru arengus juhtuma hakkab, siis suhtuge sellesse skeptiliselt. Näiteks kui keegi mainib, et varsti on meil isesõitvad autod, siis võite esile tuua, et nii Google’i asutaja Sergei Brin kui ka Elon Musk ennustasid, et isesõitvad autod on reaalsus aastaks 2017. Nüüdsel ajal neid autosid veel pole. Põhjus ei ole selles, et poleks üritatud: asjaomasesse tehnoloogiasse on investeeritud hinnanguliselt sada miljardit dollarit. Aga see, et sobivat isesõitvate autode tehnoloogiat pole veel suudetud luua, ei tähenda, et tehisarus poleks üldse mingeid sisulisi arenguid olnud.

Lihtsustatult öeldes on ChatGPT hiigelvõimas tehisnärvivõrk, millesse on sõna sõna haaval sisse treenitud peaaegu kogu internetis leiduv mõistlik (vahel ka mittemõistlik) tekst.

Revolutsioon

Suur osa meie nutikusest on salvestatud inimkeeles. Mõelge informatsioonile, mida saame raamatute, õpikute ja sotsiaalmeedia kaudu. Seega võis ehk aimata, et kui tehisaru murrab selle, kuidas inimkeelse infoga hakkama saada, siis teeb ta suure sammu edasi. Läbimurre oli paar aastat tagasi, ehkki tavainimesed said sellest teadlikuks alles 2022. aasta lõpus, kui tehti kättesaadavaks ChatGPT.

Mis võimaldas järsku saavutada häid tulemusi? Lihtsustades võib öelda, et olulised olid arvutusvõimsuse kasv ja interneti olemasolu. Internetis leidub lõputult andmeid, mida tehisaru algoritmidele sisse sööta. Arvutusvõimsus ja mõningane riistvara, näiteks graafikakaartide areng, on võimaldanud teha kindlat tüüpi arvutusprotsesse. Aga põhitegur on siiski olnud uurimistöö: Google’i teadlased on nuputanud välja paar nippi selle kohta, kuidas tehismõistust paremini treenida ja Open AI teadlased on sellele lisanud paar koostisosa.

Nii sündis ChatGPT. Lihtsustatult öeldes on see hiigelvõimas tehisnärvivõrk, millesse on sõna sõna haaval sisse treenitud peaaegu kogu internetis leiduv mõistlik (vahel ka mittemõistlik) tekst. Iga uue sisse antud sõna korral ennustab algoritm, mis peaks olema järgmine sõna. Meie aju teeb samuti selliseid ennustusi lause järgmise meloni kohta. Eelmist lauset lugedes ilmselt märkasite, et aju ennustas sõna järgmise järel meloni asemel hoopis mõnda muud sõna.

Tehisaru algoritm alguses eksib, aga kui neid ennustusi teha miljardeid ja miljardeid kordi, hakkab tema loodav tekst muutuma mõistlikuks. Sellest hoolimata on üsna uskumatu, et sellisest treeningust võib sündida nutikus. Aga kuna temasse on sisse söödetud peaaegu kogu internetist kättesaadav teadmine, siis tal ongi muljet avaldavad teadmised peaaegu kõigest, kokandusest astronoomiani ja inimsuhetest autoparanduseni.

Kui te kasutate selliseid süsteeme nagu ChatGPT, siis teadke, et ta ei kopeeri kuskilt vastuseid. Tehisnärvivõrgu parameetritesse salvestatud teadmiste abil ta pigem sünteesib ja genereerib. Seega, kui annate talle mingi teksti sisse, siis paiskab ta kõiki oma teadmisi arvesse võttes välja selle, mis võiks vastuseks sobida.

Sellest kõigest võib muu hulgas teha järelduse, et need tekstipõhised tehisarumudelid (ehk ka tekstirobotid) saavad kõige paremini hakkama nendel teemadel, mille kohta neil on palju treeninguandmeid. Seetõttu ongi raske inimestel, kes tahavad luua ilukirjandust: on tekkinud konkurents – inimesed, kes kasutavad selleks tööks tekstiroboteid. Sellega saab ChatGPT üsna hästi hakkama. Samuti leidub interneti varasalvedes palju arvutiprogrammide koode, seepärast saavad tekstirobotid hakkama ka programmeerimisega. Nii on võimalik kiiresti ja valutult kirjutada teksti. Võib-olla tekib kellelgi küsimus, kas osa selle artikli tekstist on ChatGPT kirjutatud. Siin jõuamegi keelemudelite probleemide juurde.

Artikli foto — Foto: JAAN ARU / TEHISARU

Kõik, mis hiilgab, ei …

Tekstirobotite kasutamine avaldab tõesti muljet. Need keelepõhised tehisarusüsteemid on meeldivad suhtlejad, nende teksti on kerge lugeda erinevalt professorite omast, neilt saab asju üle küsida ja täpsustada. Aga neil on ka vähemalt kaks probleemi.

Esiteks keerutavad tekstirobotid toredalt üldist jutumulli, aga tihti ei suuda nad olla piisavalt täpsed (nagu on tarvis näiteks Horisondi artikli jaoks). Seda puudust saab natuke parandada, öeldes neile süsteemidele: «Ära aja üldist udu, kirjuta populaarteaduslikult, selgelt, ilma vigadeta.»

Teine probleem on asjaolu, et kõigest hoolimata teevad need süsteemid vahel vigu. Nad teevad vigu kohtades, kus inimene neid ei teeks. Nad ajavad pada, toodavad valeinfot. Nii on väga raske kirjutada Horisondi artiklit. Niisuguste vigade kohta öeldakse kenasti, et tehisaru hallutsineerib.

Nüüd olemegi jõudnud ühe tehisaruajastu keskse küsimuseni. Kas padaajamine väheneb, kui mudelid muutuvad veelgi suuremaks, st neis on rohkem tehisneuroneid? Aga võtame arvesse, et praegusaja tekstirobotid ennustavad põhiliselt järgmist sõna või pildiühikut. On võimalik, et hallutsinatsioonid on selle algoritmi ja treenimisviisiga kaasnev probleem, mis ei kao niisama ära. See tähendab: padaajamine pole mitte väikese mudeli nüüdisprobleem, vaid on seotud tekstirobotite aluseks oleva arvutusprotsessiga. Selle üle vaieldakse elavalt ja küsimusele ei saa niisama lihtsalt vastata. Ent tasub mainida, et märkimisväärse hulga tehisaru-uurijate arvates on nutikus ja inimaru tasemel mõistus ainult tehisneuronite arvu taga. Mida suuremaks kasvavad arvutusvõimsus ja mudelid, seda lähemal inimarule ollakse, kuni see ka ületatakse.

Tundub inimlik, aga ei ole

Tänapäevaste tehisarusüsteemide peamine puudus on see, et nad tunduvad nii inimlikud. Nende jutt on inimlik, viisakas ja sõbralik, nii et tahes-tahtmata omistame neile ka inimlikke omadusi. Kui tekstirobotitega arutada, siis justkui tundub, et tegu on inimesega, aga ta ei mõtle nagu inimene. Tema aluseks olev tarkvara ei ole meie aju sarnane. Ehk kõige parem on seda erinevust mõista siis, kui saame aru, et ajus ei olegi tarkvara. Ajus on tarkvara ja riistvara omavahel nii tihedalt seotud, et erisus nende vahel kaob. Seetõttu ei ole võimalik teadmisi ühest ajust teise kopeerida või oma teadvust pilve üles laadida. Seepärast ei ole tehisaru inimarule vähemalt mõnes aspektis ligilähedale jõudnud.

Tekstirobotid on tööriistad. Vahvad ja võimsad tööriistad, aga ei midagi enamat. Kui lõpetada nende tarvitus, siis nende sees ei toimu midagi. Tehisaru ei taha midagi, ta ei mõtle ise midagi, tal ei ole soove ega visioone. Kui teie panete Horisondi käest ja sulete silmad, siis teie sees podisevad endiselt mitmekesised mõtted, teie aju töötab võimsalt edasi. Tehisaru sees nii ei ole. Seal on tühjus. Ta ei taha meid hävitada. Seetõttu ei pea me kartma mitte niivõrd tehisaru arengut, vaid loomulikku lollust. Aga sellest pikemalt juba järgmises artiklis.

Tehisaru saab kasutada mitmel moel: ta on nõus mängima peaaegu kõiki rolle. Seega on meie valida, kuidas me neid süsteeme kasutame ja kas saame neist kasu või kahju.

Kui tehisarusüsteemid ei ole nagu inimesed, siis kuidas neist mõelda? Ühe hiljuti pakutud idee järgi võiks neist mõelda kui oma rolli mängivatest dialoogiagentidest. Nad on programmeeritud olema kenad ja vastama nii, nagu kasutaja soovib. Neil endal pole mingit loomust, aga karakter kujuneb vestluse käigus. Näiteks, kui palute sel süsteemil olla veaparandaja, siis ta parandab vigu. Kui palute tal olla õhtuks meeldiv vestluskaaslane, siis ta vestleb teiega. Tal endal pole kindlaid omadusi, ta on kui kameeleon, kes etendab seda, mida vaja. See metafoor aitab meil ka paremini mõista, et tehisaru tekstirobotit saab kasutada mitmel moel: ta on nõus mängima peaaegu kõiki rolle. Seega on meie valida, kuidas me neid süsteeme kasutame ja kas saame neist kasu või kahju.

Horisondi uues artiklisarjas „Aru ja tehisaru“ vaatame, mis on tehisaru, kuidas see on saavutatud, mida tehisaru suudab ja millised on selle rakendused hariduses, aga ka riskid ja tulevikuväljavaated.

Jaan Aru (1984) on ajuteadlane, Tartu ülikooli arvutiteaduse instituudi arvutusliku neuroteaduse ja tehisintellekti kaasprofessor. Ta uurib aru, aju ja tehisaru. Avaldanud populaarteaduslikud raamatud „Ajust ja arust“ ning „Loovusest ja logelemisest“. Tööde tsükli „Aru ja tehisaru süsteemide sarnasuste ja erinevuste kaardistamine“ eest pälvis 2024. aasta riigi teaduspreemia.

Artikkel ilmus ajakirja Horisont veebruar-märts numbris.

Inimaru tehisaru ajastul (1)

Märksõnad