Skip to main content

Keelekorpused

Eesti keele andmed asuvad tänapäeval keelekorpustes. Keelekorpus on mahukas kirjalikest või suulistest tekstidest koosnev elektrooniline andmekogu, mida kasutatakse keele uurimisel ja kirjeldamisel, aga ka keeletehnoloogias. Eestis hakati sõnaraamatutöö jaoks korpusi kasutama 1990. aastatel. Korpuste ja sõnaraamatute vahel otseseos puudub, sest sõnaraamatu koostajad ja keeleteadlased analüüsivad korpusandmeid alati enne, kui nendega sõnaraamatuid või muid keeleinfoallikaid täiendavad. 

– Eesti keele ühendkorpus 2013 (563 miljonit sõna) 
– Eesti keele ühendkorpus 2017 (1,1 miljardit sõna) 
– Eesti keele ühendkorpus 2019 (1,5 miljardit sõna) 
– Eesti keele ühendkorpus 2021 (2,4 miljardit sõna)  
– Eesti keele ühendkorpus 2023 (3,8 miljardit sõna)  

Vanade allkeelte andmebaasid leiad SIIT.

Kas leidsid, et sisu on kasulik?

Jah
Ei
Sinu tagasiside on meieni jõudnud. Aitäh!