Eesti murrete 2,7 miljoni sedeliga kartoteek jõudis veebi

EKI eesti murrete ja soome-ugri keelte arhiivi (EMSUKA) veebiandmebaasi on lisatud eesti murrete tähestikulise koondkartoteegi sedelite pildifailid.
Eesti murrete tähestikuline koondkartoteek hõlmab EMSUKA kihelkonnapõhiste kogude materjali. Kartoteek koostati põhiosas 1950ndatel, eesmärgiga kasutada seda „Eesti murrete sõnaraamatu“ koostamisel.
Kartoteek sisaldab umbes 2,7 miljonit sedelit kõigi eesti murde- ja murrakualade sõnavara, mis on järjestatud tähestikuliselt. Kohanimekartoteegi kõrval on tähestikuline koondkartoteek EMSUKA kõige aktiivsema kasutusega kogu. Seni on kartoteeki põhiliselt kasutatud „Eesti murrete sõnaraamatu“ ja mitmete murde- ja murrakusõnastike koostamisel, aga ka muus uurimistöös.
Sedelite failid on struktureeritud füüsilise kogu järgi ning jaotatud otsingusüsteemis kappidele ja sahtlitele vastavatesse vahemikesse, mis on varustatud märksõnainfoga. Faile saab alla laadida webp-formaadis. Esialgu saab faile ainult sirvida, märksõna- ega kihelkonnaotsingut veel teha ei saa.
Failid paiknevad sellises järjekorras, nagu sedelid skaneerimise ajal sahtlites olid. Kuna skaneerimisele kulunud aastate jooksul on kartoteek üsna põhjalikult ümber kolitud ja samuti toimub „Eesti murrete sõnaraamatu“ toimetamistöö, ei pruugi digitaalfaili asukoht kattuda füüsilise sedeli asukohaga (alates kapist 6). Edaspidi uuendatakse aasta jooksul toimetatud sahtlite sedelite faile kord aastas.
Digiteerimine võttis aega neli aastat ning sellele kulus ligikaudu 2000 töötundi. Viis inimest skaneeris kokku 892 sahtlitäit sedeleid. Suur aitäh pühendunud töö eest skaneerijatele ja kõigile, kes olid seotud veebilahenduse väljatöötamisega!
Head avastamist ja kasutamist kõigile murdehuvilistele!
Liis Ermus
