Skip to main content

Keeleminutid. Rääkivad (pilt)sõnastikud

Kristina Koppel, Jelena Kallas 13. mai 2024

Keeletehnoloogia areneb ja koos sellega arenevad ka sõnastikud. Näiteks on tänapäeval täiesti loomulik, et sõnastik sisaldab multimeediat, selle sisu on kuulatav ning sõnastikuga saab ka rääkida, kirjutavad EKI vanemarvutileksikograaf Kristina Koppel ja EKI vanemteadur-projektijuht Jelena Kallas.

Tulevikusõnastikud muutuvad oma olemuselt tõenäoliselt aina rohkem tehisintellekti (TI) sisaldavate dialoogisüsteemide sarnasteks rakendusteks, kus saab teha päringuid nii kirjalikult kui ka suuliselt, nii ühe sõna kaupa kui ka pikemate tekstilõikudena. TI-tööriistade abiga suureneb kindlasti ka multimeedia ehk (animeeritud) piltide ja videote osakaal sõnade tähenduste seletamisel.

EKI keeleportaalides Sõnaveeb ja Keeleõppija Sõnaveeb on seni rakendatud selliseid tehnoloogiad nagu kõnesüntees ja kõnetuvastus. Sõnaveebi kasutajad on ilmselt märganud siin-seal kõlariikoone, vahest neile isegi klõpsanud. Näitelauseid loeb ette EKI-s arendatud kõnesünteesaator, mis muudab teksti kõneks. Kui ise parasjagu trükkida ei saa või viitsi, on sõnu võimalik dikteerida suuliselt – selleks kasutame Sõnaveebis Taltechis arendatud kõnetuvastust, mis muudab kõne tekstiks.

Kõnesüntees ja -tuvastus on toredad abimehed, kuid nende kasutamisel tuleb arvestada sellega, et tegemist on robot- ja mitte inimhäälega. Sel põhjusel oleme kõige sagedasematele märksõnadele ja nende põhivormidele lisanud diktorite sisse loetud helifailid – kokku umbes 13 000 sõnale. Kusjuures algajale ja edasijõudnud keeleõppijale mõeldud Keeleõppija Sõnaveebi märksõnad oma põhivormidega on üleni heliga kaetud.

Sõnaveeb sisaldab ka multimeediat – pilte ja videoid. Sõnaveebis asuvad need üksnes oskussõnastikes, näiteks pildid arheoloogia terminibaasis ning videod eesti viipekeele IT terminibaasis, kuid Keeleõppia Sõnaveebis on ka ligi kolmandiku sõnade seletusi illustreeritud piltidega. Kokku on seal 1500 pilti, nende autoreiks kunstnikud Kristel Karp ja Anni Piits-Jamnik.

Neidsamu pilte sisaldab ka 2022. aastal Sõnaveebis avaldatud keeleõppijale mõeldud eesti-vene-ukraina helindatud EKI piltsõnastik, mille kaudu saavad nii algajad kui ka edasijõudnud keeleõppijad teemade kaupa keeli õppida. Helindatud on seni küll vaid eestikeelsed pildid, kuid tulevikus saab sedakaudu kuulata ehk ka teiste keelte sõnade hääldust. Piltsõnastikus on umbes 1000 pilti ning 50 teemat (nt loomad, linnud, putukad, riietumine), samuti sisaldab piltsõnastik temaatilisi koondpilte (nt liiklus, märguväljak), mille abil saab arendada rääkimisoskust. Kuna sõnu saab vajadusel lugeda trükitähtedega, sobib piltsõnastik hästi ka lastele.

EKI-s loodud materjalid, sh helifailid ja pildid, on vabavaralised. Kui keegi, näiteks mõne keeleõppematerjali või -äpi looja tunneb nende vastu huvi, võib instituudiga julgelt ühendust võtta.

Lugu ilmus ERR-i kultuuriportaalis 13.05.2024.

Kristina Koppel

vanemarvutileksikograaf
Tänapäeva eesti keele osakond
Kristina Koppel

Jelena Kallas

vanemteadur-projektijuht
Tänapäeva eesti keele osakond
Jelena Kallas

Kas leidsid, et sisu on kasulik?

Jah
Ei
Sinu tagasiside on meieni jõudnud. Aitäh!