Keeleminutid. Kus on sõnas rõhk ja miks see masinale korda läheb?

Heete Sahkai, Liisi Piits 9. veebruar 2026

Autor/allikas: Priit Mürk/ERR

Praegune rõhu märkimise süsteem Eesti Keele Instituudi sõnastikes eeldab vaikimisi, et kui sõna järgsilbis on pikk vokaal või kolmas välde, siis on seal ka pearõhk, kuid tegelik hääldus ei vasta sellele alati, kirjutasid “Keeleminutites” EKI vanemteadurid Heete Sahkai ja Liisi Piits.

Eesti keelt peetakse tavaliselt keeleks, kus sõnarõhk on kindlalt esimesel silbil. Enamasti see nii ongi. Ent on terve rühm sõnu, mille puhul ei ole sugugi selge, kas rõhk peaks olema esisilbis või hoopis järgsilbis. Need on võõrsõnad nagu analüüs, marmelaad või laboratoorium, mis moodustavad kokku ligikaudu veerandi eesti keele sõnavarast. Mõnes võõrsõnas on algselt järgsilbis olnud rõhk liikunud ajapikku esisilbile (nt šokolaad, president, kabinet), teistes on see jäänud järgsilpi (nt meditsiin, matemaatika, alternatiivne) ja on sõnu (nt baleriin), kus mõlemad hääldused tunduvad inimestele võrdselt vastuvõetavad. Sõnaraamatud ei anna neil juhtudel infot, kus võiks rõhk paikneda.

Just see probleem tõusis esile, kui Eesti Keele Instituudis hakati arendama kõnesüntesaatorit, mis peab oskama hääldada üksiksõnu – näiteks sõnastikes, keeleõpperakendustes ja kõneteraapias. Erinevalt tavalisest teksti ettelugemisest ei aita siin lausekontekst, vaid masin peab tuginema ainult sellele, mida sõnastik ütleb sõna häälduse kohta. Kui sõnastik aga ei erista, kas rõhk on esisilbil või järgsilbil, võib ka sünteeshääl kõlada ebaloomulikult.

Praegune rõhu märkimise süsteem Eesti Keele Instituudi sõnastikes eeldab vaikimisi, et kui sõna järgsilbis on pikk vokaal või kolmas välde, siis on seal ka pearõhk. Tegelik hääldus ei vasta sellele aga alati – umbes kümnendikul sellistest sõnadest on tegelikus keelekasutuses rõhk siiski esimesel silbil. Kui masin püüab neid sõnu hääldada üksnes reegli põhjal, tekibki kuulajale mulje, et “miski on valesti”, sest tehishääl rõhutab sõnades marmelaad ja analüüs viimast silpi.

Lahendusena pakkusime välja uue rõhu märgendamise põhimõtte: sõnastikus tuleks järgsilbis asuvat pearõhku alati märkida, ka siis, kui see langeb kokku vältemärgi või pika vokaaliga. Nii saab selgelt eristada sõnu, kus rõhk on tõesti järgsilbis, nendest, kus seal on küll pikk vokaal või kolmas välde, aga sõna rõhk on liikunud esisilbile. Sama põhimõtet kasutati ka kõnesüntesaatori treenimisel.

Tulemus oli märgatav: uue märgenduse järgi treenitud süntesaator hääldas probleemseid sõnu palju inimlähedasemalt. See näitab, et täpsem ja läbipaistvam rõhu märkimine ei ole kasulik ainult sõnastike kasutajatele ja keeleõppijatele, vaid parandab otseselt ka kõnetehnoloogilisi rakendusi.

Uurimus osutab laiemale küsimusele: kui kindel on eesti keele sõnarõhk tegelikult, mis seda mõjutab ja kuidas see ajas muutub? Et uut märgendussüsteemi saaks sõnaraamatutes laiemalt kasutusele võtta, on vaja neid sõnu veel põhjalikumalt uurida. Kindel on aga see, et kui tahame, et masinad räägiksid eesti keelt loomulikult, peavad nad saama selged juhised – ja need algavad sõnastikust.

Lugu ilmus 09.02.2026 ERR-i kultuuriportaalis.

Heete Sahkai

Vanemteadur

Keeletehnoloogia osakond

Liisi Piits

Vanemteadur

Keeletehnoloogia osakond

Kas leidsid, et sisu on kasulik?

Jah

Sinu tagasiside on meieni jõudnud. Aitäh!