Keelekorpused
Eesti keele andmed asuvad tänapäeval keelekorpustes. Keelekorpus on mahukas kirjalikest või suulistest tekstidest koosnev elektrooniline andmekogu, mida kasutatakse keele uurimisel ja kirjeldamisel, aga ka keeletehnoloogias. Eestis hakati sõnaraamatutöö jaoks korpusi kasutama 1990. aastatel. Korpuste ja sõnaraamatute vahel otseseos puudub, sest sõnaraamatu koostajad ja keeleteadlased analüüsivad korpusandmeid alati enne, kui nendega sõnaraamatuid või muid keeleinfoallikaid täiendavad.
- Eesti keele ühendkorpuste sari on kaasaegseim, mahukaim ja žanriliselt mitmekesiseim eestikeelsete digitekstide kogu (loe lähemalt Koppel ja Kallas 2022).
– Eesti keele ühendkorpus 2013 (563 miljonit sõna)
– Eesti keele ühendkorpus 2017 (1,1 miljardit sõna)
– Eesti keele ühendkorpus 2019 (1,5 miljardit sõna)
– Eesti keele ühendkorpus 2021 (2,4 miljardit sõna)
– Eesti keele ühendkorpus 2023 (3,8 miljardit sõna)
- EKI Tekstikorpus
Vanade allkeelte andmebaasid leiad SIIT.
Kas leidsid, et sisu on kasulik?
Jah
Ei
Sinu tagasiside on meieni jõudnud. Aitäh!