Skip to main content

EKI keelekool 05.03.2022. Eestikeelsed automaatsubtiitrid on jõudnud otse-eetrisse

Eesti Keele Instituut 06. märts 2022

Praegusel ajal, kus inimesed peavad saama hakkama ülemaailmse pandeemia ja sõjaolukorraga, on eriti oluline, et operatiivne info jõuaks kõikide meie ühiskonna liikmeteni võimalikult kiiresti. Automaatsed reaalajalised subtiitrid on üks samm selle saavutamisel. Keeletehnoloogia arengutest kirjutab Eesti Keele Instituudi keeletehnoloogia kompetentsikeskuse juht Susanna Oja.

subtiitrid pilt

Kuni eelmise aastani oli meie ainus võimalus eestikeelsete reaalajaliste subtiitrite tekitamiseks nn inimliidese kasutamine ehk et kaadri taga toimetas üks usin inimene, kes kõik kuuldu võimalikult kiiresti kirja pani. Kuid nüüd on TalTechi keeletehnoloogia laboratoorium loonud subtiitrite genereerimiseks kõnetuvastusel põhineva kiirkirjutaja lahenduse.[1]

Alates 1. märtsist on võimalik ETV otsesaadetele lisada automaatselt genereeritud reaalajalisi subtiitreid, mille kõige olulisemaks sihtgrupiks on eesti keelt kõnelevad vaegkuuljad. Nendel ei ole võimalik otsesaadetest – uudistest, pressikonverentsidest, valimisstuudiotest jms – päevakajalist infot kuulata, mis tähendab, et oluline teave jõuab nendeni alati teatava viivitusega. Kuna informatsioon võib muutuda ruttu, eriti kriisiolukordades, on oluline, et ka nemad saaksid info kätte samaaegselt ülejäänud eesti keele kõnelejatega.

Lisaks ligipääsetavuse parandamisele saavad eestikeelsed subtiitrid olla kasulikuks abivahendiks ka teistele sihtgruppidele: näiteks neile, kes õpivad eesti keelt teise keelena. Kõik, kes mõnda võõrkeelt on õppinud, teavad, et õpitavast keelest on märksa lihtsam aru saada, kui lisaks kuulamisele on võimalik jälgida räägitavat tekstina. Samuti on subtiitrite abil võimalik suurendada kuuldud info vastuvõtmist nii keeleõppijate kui ka emakeele kõnelejate jaoks. On inimesi, kes omandavad infot paremini kuulates, kuid mõne inimese jaoks on sisu oluliselt paremini meeldejäävam, kui tal on võimalik seda lugeda. Lisaks teevad subtiitrid võimalikuks info edastamise neile, kes viibivad mürarikkas keskkonnas ning kellel pole võimalik saadet kuulata.

Loomulikult on eestikeelsel kõnetuvastusel veel arenguruumi ning tänastes subtiitrites võib vahel kohata kentsakaid vigu, kuid siiski on see oluline abivahend teabe edastamisel. Hetkel on kõnetuvastuse täpsus umbes 85%, kuid ära ei tohi unustada, et ka inimesed ei tuvasta kõnet alati sajaprotsendiliselt. Mõelge kõikidele nendele kordadele, kui olete kuulnud oma vestluskaaslast lausumas midagi eriti kummalist, et siis hiljem avastada, et see, mida sina kuulsid, polnud üldse see, mida tema ütles. Lisaks sõltub tuvastuse kvaliteet ka sellest, kui selgelt või kiiresti kõneleja räägib, kui palju on taustamüra, kui hea on salvestuse kvaliteet jms. TalTechi teadlased tegelevad pidevalt kõnetuvastuse edasiarendamisega, mis tõstab aja jooksul ka subtiitrite kvaliteeti.

Automaatsed subtiitrid on meie väikese keele jaoks täna juba tegelikkus ning sellise keeletehnoloogilise taseme üle tasub meil palju uhkust tunda.

Artikkel ilmunud ajalehes Postimees 05.03.2022.


[1]Vabavaralise tarkvara kood: https://github.com/alumae/kiirkirjutaja

Foto: Ken Mürk, ERR

Kas leidsid, et sisu on kasulik?

Jah
Ei
Sinu tagasiside on meieni jõudnud. Aitäh!