Skip to main content

Keeleminutid. Kas arvuti oskab rääkida sama hästi kui inimene?

Eesti Keele Instituut 24. oktoober 2022
 
Viimased aastad on tõhusalt muutnud ka audioraamatute maailma. Avalike ürituste korraldamise piirangud jätsid jõude helitehnikat, näitlejatel tekkis palju vaba aega ja inimeste elurutiini segipaiskamine tõi tagasi huvi raamatute vastu. Kõik need killud kokku andsid tulemuseks ridamisi uusi heliraamatuid. Tegijad said rakendust, kasutajad kõrvarõõmu.

audioraamat

 
Ei saa öelda, et heliraamatud tekkisid tühja koha peale. Raamatuid on Eesti Pimedate Raamatukogu jaoks ette loetud ja salvestatud juba aastakümneid, nii koolitatud häälte kui lihtsalt entusiastide poolt. Nutiseadmetes töötavad audioraamatute äpid olid juba ümber lükanud arvamuse, et „Tõde ja õigust“ kuulama küll massiliselt ei hakata. Lapsevankriga jalutades või kaugliinibussis loksudes on jutustaja hääl hea kaaslane. Sünteeskõne kasutusvaldkondi on niisiis üllatavalt palju.
 
Uusi raamatuid, rääkimata juba ajakirjadest, ajalehtedest, blogidest, ilmub Eestis igal aastal mitu tuhat, aga heliraamatuks muutub neist ainult väike osa. Nende raamatutega, mille jaoks diktori jõudlus või kirjastaja huvi pole piisav, tuleb appi kõnesüntees. Arvuti oskab teksti sünteeshäälega iga aastaga aina paremini ette lugeda. Eesti Keele Instituudis tehtava arendustöö praktiline väljund on ebaoriginaalse nimega teenus Vox Populi (https://heliraamat.eki.ee/voxpopuli/), kus kasutaja laadib üles teksti ja saab vastu valitud häälega tekitatud helifaili. Läbi aastate on valminud juba 14 000 teksti, suur osa neist raamatud. Teine abivahend saidil on transkriptsioonisõnastik, mis esitab võõrnimesid ette loetaval häälduspärasel kujul.
 
Kõnesünteesi eesmärki sõnastada on lihtsamast lihtsam – arvuti lugegu tekst ette nii, nagu seda oleks lugenud inimene. Teine asi on, kuidas seda saavutada. Arvuti ei saa valida, mida talle lugemiseks antakse – tabelite, allmärkuste, võõrkeelsete vahelõikude või valemite lugemisega ei tule ka inimene toime. Teksti ettevalmistus on oluline, vähemalt araabia numbrid tuleks teisendada õiges käändes sõnadeks, lühendite puhul tuleks otsustada, kuidas neid lugeda, või äkki ununes kirjutajal suurtähelukk sisse. Komistuskive, mida inimene ei märkagi, on palju ja kõigele polegi „õiget“ lahendust. Seetõttu läheb kõnesünteesi parendamisel peatähelepanu ikkagi sellele, kuidas sünteeshääl panna kõlama arusaadavalt, nii et välted, rõhud ja fraasid oleksid õiges kohas, ilmekalt, aga mitte liiga ilmekalt, sest pikemal kuulamisel see pigem väsitab.
 
Eks näis, kas uus põlvkond sünteeshääli (nüüd juba närvivõrkudel õpetatud) suudab inimdiktoriga võistelda. Mida rohkem õppematerjali, seda parem saab tulemus. Igaüks saab kaasa lüüa. Aga ka ebatäiuslikul kõnesünteesil ja Vox Populil on ja jääb oma osa vähemnõudlike tekstide helindamisel.
 
Kuula SIIT, kuidas loeb keeleminuteid sulle ette meie tehishääl Tambet!
 
Indrek Hein, Eesti Keele Instituudi vanemtarkvaraarendaja  
Lugu on ilmunud ERRi kultuuriportaalis 24.10.2022.
 

Kas leidsid, et sisu on kasulik?

Jah
Ei
Sinu tagasiside on meieni jõudnud. Aitäh!