Distributsiooniindeksi kalkulaator
Distributsiooniindeksi kalkulaator näitab, kas ja kuivõrd erineb käändsõna suhteline sagedus Ühendkorpuses 2019 käändsõnadele üldisest omasest suhtelisest sagedusest. Sagedusnormid on arvutatud tuginedes varem avaldatud statistikale käändekategooriate esinemisest eestikeelsetes tekstides. Normide arvutamise ning kalkulaatori loomise protseduurid on kirjeldatud artiklites (Vainik jt 2021a, Vainik jt 2021b ja Paulsen jt 2021).
Suhtelise sageduse lävend DI = 0,130 on seatud empiiriliselt võrreldes normaalse jaotusega ning paradigmadest irduma kippuvate sõnavormide suhtelise sageduse näitajaid. Lävendist suurema suhtelise sagedusega vormid on varustatud sildiga „kriitiline“. Kalkulaatori näit on heuristik, mis osutab statistilisele tendentsile. Sõnavormi leksikograafilise staatuse üle otsustamine jääb leksikograafi ülesandeks, kes kaalutleb sõnavormi morfosüntaktilisi, semantilisi ja paradigmaatilisi jm omadusi.
Kirjandus
- Vainik, Ene; Paulsen, Geda; Lohk, Ahti (2021a). Käändevormist sõnaks: mida näitab sagedus? Eesti Rakenduslingvistika Ühingu aastaraamat = Estonian papers in applied linguistics, 17, 285−307. DOI: 10.5128/ERYa17.16.
- Vainik, Ene; Lohk, Ahti; Paulsen, Geda (2021b). The Distribution Index Calculator for Estonian. Electronic lexicography in the 21st century. Proceedings of the eLex 2021 conference.: eLex 2021 conference: Post-editing lexicography; 5–7 July 2021, virtual. Ed. Kosem, I., Cukr, M., Jakubíček, M., Kallas, J., Krek, S. & Tiberius, C. Brno: Lexical Computing CZ, s.r.o, 121−138.
- Paulsen, Geda; Vainik, Ene; Lohk, Ahti; Tuulik, Maria (2021). Catching lexemes. The case of Estonian noun-based ambiforms. Electronic lexicography in the 21st century. Proceedings of the eLex 2021 conference.: eLex 2021 conference: Post-editing lexicography; 5–7 July 2021, virtual. Ed. Kosem, I., Cukr, M., Jakubíček, M., Kallas, J., Krek, S. & Tiberius, C. Brno: Lexical Computing CZ, s.r.o, 288−311.