Skip to main content

Projektid ja tegevused

Projekti raames töötatakse välja teoreetilised ja metodoloogilised eeldused sõnavara ja grammatika seoste ning teise ja võõrkeele lingvistilise pädevuse kirjeldamiseks ühtses multifunktsionaalses leksikograafilises ressursis. Projekt viib edasi korpus-  ja  arvutileksikograafia  uusimaid  suundumusi  ja  täidab  lünga  eesti  keele  õppimise  ja  õpetamise  ressurssides, lähtudes kasutuspõhisest ja konstruktsioonipõhisest lähenemis-viisist keeleteooriale ja keele omandamise teooriale ning leksikograafiale. 

Erasmus+ programmi raames on rahastatud projekti “TELMER – Tell me, how to say it right!”. 

Projekti eesmärk on koostöös Tšehhi Keele Instituudiga välja töötada keelenõustamise hea tava, mis käsitleks selles töös ettetulevaid tüüpprobleeme, ja luua nõustajatele edaspidises töös vajalik  koolitusprogramm. 

Projekti koduleht

Kvaliteetse ja täpse sõnastikuinfo esitamine on aeganõudev väljakutse, mistõttu on oluline leida uusi vahendeid tööprotsessi tõhustamiseks. Uurime, kuidas saaksid suured keelemudelid (SKM), nagu näiteks GPT, sõnastikuinfo esitamisel abiks olla. Hindame ja testime SKM-ide võimekust erinevate sõnastikuüksuste (nt tähendused, registrid) analüüsil ja loomisel. Võrdleme SKM-ide väljundi kvaliteeti praegu leksikograafias kasutusel olevate korpustööriistade väljundiga ja leksikograafi koostatud keeleinfoga. Väljundi hindamisse kaasame eksperte ja sõnastikukasutajaid. Projekti tulemusel uuendame sõnastikutöö meetodeid, rakendades uusi tehnoloogilisi võimalusi, ja loome uusi keeleandmestikke, mida leksikograafid saavad oma töös kasutada. Projekt panustab sellesse, et EKI keeleportaal oleks ühiskonnale mugav ja ajakohane abivahend.

Projektil on kolm eesmärki, millega täidame lünki eesti keele kirjelduses ning pakume sisendit sünteeskõne kvaliteedi hindamiseks ja parandamiseks. Esimene eesmärk on uurida tänapäevaste statistiliste ja iseõppivate tekst-kõne-sünteesi meetodite potentsiaali kõneandmestiku analüüsimisel (ingl k analysis-by-synthesis), et täiendada foneetika ja fonoloogia metodoloogiat. Projekti teine eesmärk on uurida kahte eesti keele vähe käsitletud valdkonda, mis ühtlasi kujutavad endast väljakutset tekst-kõne-sünteesile: prosoodilist fraseerimist ja kõnestiile. Kolmandaks on kavas uurida erinevate sõnade hääldustava, et pakkuda tuge leksikograafidele ja morfoanalüsaatorite arendajatele sõna häälduse märkimisel.

Vaata lähemalt

Projektil on kaks eesmärki. 1) Ennekõike on sihiks analüüsida eesti erinevaid allkeeli ajavahemikust 1500–1800, laenates kirjandusteadusest heteroglossia mõistet, mille võttis kasutusele Mihhail Bahtin. 2) Teiseks eesmärgiks on valmistada trükiks ette kaks väljaannet, mis on seotud kõnealuse perioodi kõige olulisema allkeele, eesti kirjakeele tekkimisega. Projekt hõlmab kahte mahukat väljaannet: „Ajalooline piiblisõnastik“ ja „Psalmid. Esmatõlge“.

Vaata lähemalt

Projekt jätkas tööd, mida alustasime projektis EKKD64 „Eesti keele sõnavara ja korraldus: deskriptiivne ja preskriptiivne vaatenurk (2019–2022). Projekti tulemuste toel oleme ajakohastanud sõnavarakorralduse põhimõtteid ja keeleinfo esitust EKI ühendsõnastikus, keskendudes järgmise õigekeelsussõnaraamatu ÕS 2025 vajadustele. Aastail 2019–2022 on ilmunud kümmekond artiklit. Uurimistöö toetub kasutuspõhisele keeleteooriale ja korpuslingvistikale. 
 
Projekti tulemustest oleme teinud ja teeme edaspidi lühiülevaated EKI teatmikus, vt nt “Paronüümid”, “Tähenduste normimisest”, “Mis on tekstikorpus”. Samuti oleme neid tutvustanud populaarteaduslikes kirjutistes, mida on avaldanud nt Eesti Rahvusringhääling või Sirp. 
 
Kuivõrd järgmine õigekeelsussõnaraamat ÕS 2025 ilmub keeleportaalis Sõnaveeb, siis projekti tähtsaim lähieesmärk on edasi minna kavandatud kasutajauuringutega, samuti jätkata sõnavarateemade käsitlemist. Plaanis on alustada ka morfoloogiaprobleemide käsitlemist.

Vaata lähemalt

Eestikeelse tekst-kõne-sünteesi projekti esimene eesmärk on saavutada loomulikum ja väljendusrikkam väljundkõne, mis kaugema eesmärgina võimaldab kõnesünteesi laiema kasutuselevõtu tänu paremale kvaliteedile. Projekti teine eesmärk on luua murdekeelseid sünteeshääli eri murdeid ja murrakuid kõnelevatele aktiivsetele kogukondadele, et tugevdada sellega murdekeele positsiooni ja säilitada kohalikku identiteeti. Lisaks väljendusrikkusele pööratakse sünteeshäälte loomisel tähelepanu ka nende rakendatavusele. Seetõttu on häälte loomisel kavas kasutada eri meetodeid, mis peaks tagama nende kasutatavuse eri seadmetel ja kasutusolukordades. Projekti tulemusena valmivad väljendusrikkad ja mitmekesised, eri meetoditel loodud sünteeshääled, mis vastavad paljude sihtgruppide ootustele ja on kasutatavad mitmesugustel eesmärkidel.

Vaata lähemalt

Ekilexi arenduse II etapis muudeti Ekilexi ja Sõnaveebi kasutamine tavakasutajale ja valdkonnaekspertidele mugavamaks, hõlpsamaks ja kiiremaks ning suurendati esitatava info hulka.

Vaata lähemalt

Tekst-kõne-süntees on tehnoloogia, mis muudab kirjaliku teksti kõneks. Kõnesüntesaatoreid on Eestis seni kasutatud kirjalikus žanris tekstide ettelugemiseks. Kõik praegused sünteeshääled on treenitud etteloetud kõnel ja sobivad hästi uudiste või õppematerjali ettelugemiseks. Spontaanses kõnestiilis rääkivaid sünteeshääli pole veel mitte ühtegi. Neid aga läheb järjest enam vaja süsteemides, kus kõne peaks kõlama nii, nagu oleks tegu loomuliku vestlusega, näiteks juhud, kui inimese enda kõnevõime on häiritud ja ta kasutab suhtluses abivahendina kõnesüntesaatorit, virtuaalsed assistendid, sõnumivahetused, subtiitrite ettelugemine jms. Meie soovisimegi luua Eesti esimest spontaanses kõnestiilis kõnelevat süntesaatorit. Selleks kogusime ja märgendasime spontaanse kõne korpused ja treenime iseõppivatel meetoditel sünteeshääli. Projekti tulemusel valmis spontaanses stiilis kõnesüntesaatori prototüüp, mida on võimalik kasutada süsteemides, mis vajavad väljundina spontaanset kõnet.

Vaata lähemalt

Projekti eesmärk oli koguda koostöös Tartu ülikooli arvutiteaduse instituudiga vähemalt 100 tundi kõnematerjali, luua selle materjali pealt eestikeelse kõnesünteesi mudelid, täiendada teksti eeltöötlust ning hinnata valminud mudelite kvaliteeti.

Vaata lähemalt

Projekti tulemusena valmis kõnesünteesi veebikeskkond Kõneveeb, mis võimaldab kasutajal nii oma kõnekorpusest (nt iseenda häälest) sünteeshääl treenida kui ka kasutada varem loodud mitmekesiseid eestikeelseid sünteeshääli kõikvõimalike tekstide helindamiseks. Lisaks pakub keskkond mugava juurdepääsu olemasolevatele ja tulevastele rakendustele/teenustele, sealt on võimalik sünteeshääli alla laadida ja leida juhised, kuidas kõnesünteesi oma toodetesse integreerida.

Vaata lähemalt

Projekti eesmärk oli luua Euroopa Liidu keskne terminibaas, kuhu liikmesriigid saavad liita oma terminibaasid ja kus kasutajad saavad teha ühisotsingut. Keskne terminibaas liideti omakorda eTranslationi masintõlkesüsteemi ja ELRC-SHARE’i repositooriumiga. Liikmesriikidele loodi ka keskne terminihaldussüsteem, mida saab kasutada terminitööks ja mille kaudu liituda keskse terminibaasiga.

Vaata lähemalt

Projekti eesmärk olid leksikoloogilised alusuuringud, mis keskendusid sõnavarale ja keelekorraldusele: uutele sõnadele ja tähendustele ning keeletrendidele (nt muutustele morfoloogias), mis vajaksid keelekorralduslikku hinnangut; keelenormingute ajaloolistele etappidele; sõnade semantilistele suhetele. Keelekorraldusteooria põhimõtteid uuendatakse, arvestades tegelikku keelekasutust ja uusi digivõimalusi info analüüsimisel: uuendatavad korpused, korpuspäringusüsteemid, veebiplatvorm Neoveille uute sõnade tuvastamiseks. Sõnavara, morfoloogiat ja keelenõuandeid analüüsiti deskriptiivsest ja preskriptiivsest vaatenurgast. Uue infoga täiendati sõnastikusüsteemi Ekilex ja keeleportaali Sõnaveeb. Uurimuse tulemused kajastuvad ÕS 2025-s. Sõnaveebis esitatakse põhjendused ja selgitused selges keeles ja eksplitsiitselt, nii et keelekasutaja saab soovitusest aru ja (ideaalis) tahab neid järgida.

Vaata lähemalt

Projekti eesmärgiks oli kindlaks teha võimalikud protoeuroopa substraattüved ja neile iseloomulikud häälikulised jooned eesti, liivi ja vadja keeles. Selleks analüüsiti vaatlusaluste keelte seni kindla etümoloogiata tüvevara etümoloogiliste meetoditega, keskendudes eelkõige loodust tähistavale tüvevarale (faunat, floorat, maastikku ja ilmastikku tähistavad tüved). Sel viisil leitud tüvede seas ei õnnestunud kindlaks teha substraattüvedele ainuomaseid jooni, kuid leidus tüvesid, millel oli Enn Ernitsa poolt välja pakutud substraattüvedele iseloomulikke jooni (sõnad, mis sisaldavad 1) konsonantühendit, mille esimene või viimane komponent on r: -rC-/-Cr-, 2) algushäälikut h-, 3) konsonantühendit -hC-, ning 4) afrikaate). Seejuures on oluline, et need häälikulised jooned ei ole substraatsõnavarale ainuomased ja selliste häälikuliste joontega tüvesid leidub ka muu päritoluga laentüvede ning soome-ugri omatüvede seas. Kõige tulemusrikkam oli botaanilise tüvevara analüüs, milles leidus mitmeid iseloomuliku häälikulise koostisega tüvesid ning mille põhjal ilmus ka seni ainuke projekti käigus valminud teadusartikkel.

Vaata lähemalt

Projekti eesmärk oli otsida lahendusi eesti keele sõnaliikide probleemidele, mis valmistavad raskusi eriti just rakenduslike lahenduste väljatöötamisel. Uurimus keskendus problemaatilisematele rühmadele: noomenadverbidele, noomenadpositsioonidele ja noomenadjektiividele. Projekti teoreetiline eesmärk oli teha kindlaks osalise produktiivsuse ja mittekompositsionaalsete üksuste ulatus, määratleda nende üksuste omadused ning töötada välja ühtne kirjeldus. Uurimuse metodoloogiline siht oli välja arendada korpuseotsingut täiustav rakendus leksikograafilise töö lihtsustamiseks, andmaks leksikograafile ja ka keeleuurijale ülevaate sõna süntaktilisest ja kollokatiivsest käitumisest keelekasutuses ning leksikaliseerumise astmest. Uurimust motiveeris hüpotees, et statistiline, korpusest tulenev analüüs võimaldab senisest paremini määratleda konkreetsete sõnade sõnaliigilist kuuluvust ja leksikaliseerumise astet.

Projekti raames koguti terminibaase ja sõnastikke masintõlke arendamiseks ELi digiteenuste jaoks. Kogusime Eesti, Malta ja Tšehhi terminiressursse kolmes valdkonnas: tervis, tarbijakaitse ja äriõigus. Eesmärk on muuta paremaks masintõlke kvaliteeti Euroopa e-õiguskeskkonna portaalis (European e-justice portal), internetipõhisel vaidluste lahendamise platvormil (Online Dispute Resolution platform) ja e-tervise võrgustikus (eHealth Network).

Vaata lähemalt

On loodud sõnastike ja terminibaaside haldus- ja koostamissüsteem EELex2, mis aitab parandada sõnastike ja terminibaaside kvaliteeti ning pakub paremat tuge nende loojatele. Erinevates süsteemides olevad sõnastikud, terminibaasid ja leksikonid tuuakse ühte süsteemi. Jätkuvalt toetatakse EKI teadlaste mobiilsust ja välisteadlaste kaasamist ning jätkatakse doktorikooli koostöös Tartu Ülikooli, Tallinna Ülikooli ja Eesti Kirjandusmuuseumiga.

Vaata lähemalt

Kas leidsid, et sisu on kasulik?

Jah
Ei
Sinu tagasiside on meieni jõudnud. Aitäh!