Keeleminutid. Eestikeelne TI-hüpe

Ülesandeid, mida saab TI abil täita kergemini kui ilma, polegi ju mõistlik teha ilma. Kui eesmärk on saada kraav, siis ei ole mõtet ekskavaatoriga võidu kaevata, kirjutas EKI direktor Arvi Tavast “Keeleminutites”.
Algava TI-hüppe eesmärk ei ole õpilaste eest ülesandeid ära teha ja seeläbi õppimist vähendada, nagu kardetakse. Vastupidi, eesmärk on toetada tõeliselt huvitavate asjade õppimist, jättes lihtsad masinale. Kui keeleline vorm on üks neist rutiinsetest, lahendatuks loetud ülesannetest, siis on aga mudelite eesti keele kvaliteet kriitiliselt tähtis.
Mitmel pool, ka näiteks oma lapse kooli vanemate listis näen muret, et mis siis saab, kui masin lapse eest kõik koduülesanded ära teeb. Laps siis ju ei õpi. Jah, just selle olukorra lahendamine ongi TI-hüppe mõte – ainult et mitte laiatarbe-tööriistade keelamise teel (nagu meil omal ajal pidid kalkulaatorid matemaatikatunnis olema salaja laua all), vaid just vastupidi, nende tööriistade abil.
Ülesandeid, mida saab TI abil täita kergemini kui ilma, polegi ju mõistlik teha ilma. Kui eesmärk on saada kraav, siis ei ole mõtet ekskavaatoriga võidu kaevata. Samamoodi, kui eesmärk on saada lahendatud kooliülesanne, mille lahendab edukalt ära ka kõigile kättesaadav masin, siis on lihtsalt ebaotstarbekas toda masinat mitte kasutada.
Ilmse vastuväite ennetamiseks lisan, et muidugi on mõtet treenimisel, nii keha kui ka vaimu. Küsimus on eesmärgis – kas lahendatud ülesanne või lahendaja areng. Näiteks neid keeleminuteid kirjutan pühapäeval Tihemetsas, kus istun vihmavarjus keset 360-kilomeetrist rattasõitu Tallinnast Läänemaa ja Pärnu kaudu Tartusse. Kui eesmärk oleks jõuda kohale, siis oleks mingi mootorsõidukiga liigelda palju lihtsam ja kuivem. Ja tegelikult poleks siis üldse tarvis täna siinkandis olla, vaid oleksin võinud sõita esmaspäeval rongiga otse Tartusse. Aga see oleks hoopis teine ülesanne. Praegune eesmärk on nautida rattasõitu ja loodust ja tunda rõõmu oma jaksamisest.
Treeningu analoogiaga jätkates märgakem, et see on saanud võimalikuks ainult tänu elustandardi üldisele paranemisele, sh tehnika arengule. Kui kraavi kaevab ekskavaator, siis tekib endistel labidameestel aega ja raha jõusaali jaoks, kuhu nad erinevalt oma varasemast samuti füüsilist koormust andnud tööst lähevad vabatahtlikult ja maksavad veel pealegi. TI, sh koolis kasutatav TI ei ole selles mõttes midagi ennekuulmatut. Ka siin võimaldab rutiinsete tööde automatiseerimine vabastada inimeste aega päriselt huvitavate ülesannete jaoks – ja lõppkokkuvõttes võiks kõige huvitavam ülesanne olla inimese isiklik areng.
Rutiinsete ülesannete hulgas, mida oleme kohati harjunud juba lahendatuks pidama, on olnud ka palju keelega seotut, eriti tekstide keelelise korrektsuse tagamine, millega suur osa kooli õppekavast on seni tegelenud. Ka kokkuvõtted ja ümberjutustused, mida samuti koolis nõutakse, on olnud praeguse tegelikult ju veel päris algelise TI esimeste nähaolevate tugevuste hulgas. Keelemudelite räägitav eesti keel on sealjuures olnud piisavalt laitmatu, et õigustada võrdlust ekskavaatoriga kraavikaevamisel.
Viimaste mudelite, eriti GPT5 tulek aga tekitab sel teemal kahtlusi. Paljudele tundub, et eesti keele kvaliteet seal on alla käinud. Seda allakäiku vettpidavalt mõõta on väga keeruline, sest keelekvaliteedi hindamiseks on tarvis keeleteadmist, see aga elab tänapäeval sealsamas keelemudelites, ehk me saaksime panna ühe mudeli hindama teise mudeli kvaliteeti. Aga kust me teame, et esimese mudeli hinnang on mõistlik?
Tegelikult on asi palju lihtsam ja inimlikum. Kui eesti keele kõnelejatele tundub, et keelega on midagi valesti, siis nii ongi – mudel ei kajasta inimeste keeletaju adekvaatselt. Ja see on juba päris suur probleem, kui tahta rutiinsemat osa keelelise vormiga tegelemisest masinale delegeerida, eriti koolis.
Miks see kvaliteet üldse alla läinud on? Ega me tegelikult ei tea. TI-hüppe üks juba nähaolevaid kasulikke tulemusi on senisest palju parem juurdepääs suurte tegijate tehnilistele inimestele, et neilt just selliseid asju küsida, aga vähemalt praeguse kirjutamise ajaks ei ole neiltki paremat infot tulnud.
Üks tugev hüpotees siiski on, nimelt eri keelte materjali mahud keelemudelite treenimisel. Kõnelejate arvust, tekstide hulgast ja kättesaadavusest tulenevalt on eestikeelsete tekstide osakaal kogu treeningmaterjalist seni olnud hinnanguliselt 0,1% kandis, millest on piisanud meile nüüdseks juba harjumuspärase keelekvaliteedi saavutamiseks. Tootjad aga arendavad oma mudeleid edasi, sh hangivad juurde treenimiseks sobivaid tekste, ka inglise keeles. Praegune hüpotees ongi, et kui eesti keelekorpuse maht on seni umbes kahekordistunud iga kahe aastaga, siis inglise oma kasvab veel kiiremini ja on nüüdseks juba põhjustanud meie kriitilise mahajäämuse.
Ega siin muud lahendust ei ole, kui et paigal püsimiseks tuleb veel kiiremini joosta. Mudelite treenimise etappe ja nendeks sobivaid materjali liike on palju, sealhulgas ka spetsiaalselt selleks loodud sisu, millega samuti eesti keele puhul tegeleme, kaasa arvatud TI-hüppe osana. Tähelepanu aga vajab siiski ka kõige traditsioonilisem treeningmaterjali liik – olemasolevate, teadaoleva kvaliteediga tekstide kogumine, nendega seotud õiguslike probleemide lahendamine ja tulemuse kasutamine mudelite kvaliteedi parandamiseks. Selleks oleme lubanud käesoleval aastal eesti korpuse mahu mitte kahe-, vaid neljakordistada, 15 miljardi tekstisõnani. Et seda hoomamatut numbrit veidi paremini ette kujutada, siis raamatutesse trükituna täidaks see umbes neli riiulikilomeetrit.
Töö korpuse kogumisega käib, äsja on välja kuulutatud ka rahaline toetusmeede avaliku sektori asutustele oma olemasolevate tekstide korrastamiseks ja avaldamiseks. See 15 miljardit on küll oluline vahe-eesmärk, aga töö ega vajadus sellega ei lõppe, pigem ikka jätkab kasvamist kogu ettenähtavas tulevikus, et eesti keel ja kultuur oleks adekvaatselt esindatud ka järgmistes mudelipõlvkondades.
Lugu ilmus 01.09.2025 ERR-i kultuuriportaalis.
