Mis on Linguae - EKI teatmik

Sisukord

Andmebaasi sisu

Andmebaasi on võetud kõik keelte nimetused, mis esinevad vähemalt ühes järgmistest allikatest: 1) Paul Ariste „Maailma keeled“ (I, 1967; II, 1969; 2. trükk 1972); 2) „Eesti nõukogude entsüklopeedia“ (1968–1978) ja „ENE/Eesti entsüklopeedia“ (1985–1999) maailmajagude keelekaardid; 3) Emakeele Seltsi keeletoimkonna soovitatud keelte ja rahvaste nimetused (1998, sisaldab peaaegu kõiki standardites ISO 639-1 ja 639-2 mainitud keeli). Kui varasemaid keelenimetusi ei ole olnud võimalik üheselt seostada praegu tuntud keelte nimetustega, on vanemad variandid varustatud märkusega „küsitav“. Mõnel juhul on nüüdisvariant jäänud üldse kindlaks tegemata, sel juhul on viide kirje tekstis.

Primaarne on andmebaasis keelenimetus, vastav rahvanimetus (etnonüüm) lisatakse, kui see on keelenimetusega seostatav (uues andmebaasis eraldi kirjena). Etnonüümil antakse tavaliselt ainsuse kuju ehk rahvaliikmenimetus.

Keeled või murded?

Põhiliselt on joondutud ISO 639 standardis antud määratlustest, mida kajastavad nt Ethnologue’i andmebaas ja Linguist List. Seejuures on ära kasutatud ISO 639-3s pakutud nn makrokeele mõistet: kui mingi rahvas peab ennast üheks ja kasutab oma keele tähistamiseks kindlat nimetust, ent lingvistiliselt on tegu eri keeltega, siis on ISO standardis seda nimetatud makrokeeleks. Nii on kurdi keele puhul tegemist ühtse identiteediga, mida kajastab kurdi makrokeel, ent lingvistiliselt on tegu vähemalt kolme keelega (põhjakurdi ehk kurmandži, keskkurdi ehk sorani ja lõunakurdi). Kui makrokeele kontseptsioon toodi algul käibele ISO standardite ISO 639-1, 639-2 ja 639-3 kokkusobitamiseks (esimesed kaks osa käsitasid keeltena mõnevõrra laiemaid kooslusi), siis siinses andmebaasis on seda laiendatud ka nendele keeltele, mis ISO 639-1s ega 639-2s ei esine, ent moodustavad siiski ühtse identiteedi (ISO 639-3 on seevastu neid killustanud mitmeks kõneldavaks keeleks).

Kuivõrd osa eespool nimetatud allikates mainitud keeli liigituvad tänapäeval murreteks, siis on ka need andmebaasis antud. Murrete põhjalikumat esitust ei ole siiski siinsest andmebaasist põhjust eeldada. Lisatud on üksnes meie lähimate naaberkeelte murdeid.

Keelte liigitus keelkondadesse

Aluseks on peamiselt võetud ENE-EE keelekaartidel antud liigitused, ent arvestatud on ka uuemaid käsitlusi (sh Ethnologue ja Linguist List). Ameerika indiaani keelte puhul on antud hüpoteetilised hõimkonnad ja suurhõimkonnad, kuigi valdav osa nüüdiskäsitlusi neid ei järgi. Keelte liigitusega seotut on vahel kommenteeritud täiskirjes.

Andmebaasi peaeesmärk on kokku viia eri nimekujud, mida keelte, rahvaste, keelerühmade jne tähistamiseks tarvitatakse, ja valida neist välja keeleliselt soovitatavad. Baasis kajastuvaid liigitusi keelteks ja murreteks, keelkondadeks jm-ks ei saa pidada lõplikeks, kasutajale jääb alati võimalus neid omatahtsi sobitada. Kui näiteks baasis on karjala, livviko ja lüüdi keel, siis ei tähenda see muud kui et ISO standardis on neile keelekujudele antud oma koodid, see ei välista näiteks karjala keelest ja selle Aunuse ja lüüdi murretest kirjutamist. Keelerühmade nimetuste puhul on tarvis silmas pidada, et kuigi paljud nimetused on sünonüümsed, on neile eri autorid andnud ka eri tähendusi (vt nt märkust Nigeri-Kordofani keelte all).

Nimetuste valik ja vormistus

Keeli ja rahvaid on nimetatud mitmeti. Mitmeid traditsioonilisi nimetusi peavad vastava keele kõnelejad ise mõnikord halvustavateks. Sel juhul on ka eesti keeles püütud senine nimetus asendada uuemaga, mis lähtub tavaliselt rahva endanimetusest. Mõned näited muudatustest: auka > vaorani, birale > ongota, galla > oromo. Piiritlemine on siiski keeruline, näiteks ei pea eesti õigekeelsusallikad mustlast ega laplast halvustavaks, kuigi inglise tavas eelistatakse nende puhul omakeelseid nimetusi.

Standardi ISO 639-3 aluseks on Ethnologue’i andmebaasis kasutatavad nimetused. Erinevalt standardi teistest osadest (ISO 639-1 ja -2) püüab Ethnologue keeli liigitada nö objektiivsete kriteeriumide alusel, kasutades mõistetavuse printsiipi: kui kahe keelekuju kõnelejad saavad teineteisest piisavalt hästi aru, on tegemist sama keele murretega, kui ei, siis eri keeltega (vt selle kohta lähemalt ISO 639-3 määratluste lehelt). Selle tulemuseks on paljude keelte killustamine mitmeteks keelekujudeks ja neile täiesti tinglike nimetuste andmine, milles eristava täiendina kasutatakse kas kohanimesid või ilmakaari. Vastava keele kõnelejad ise ei pruugi niisugustest nimetustest teadlikudki olla ja loevad end tavaliselt suurema koosluse osaks (need on sel juhul makrokeeled, vt eespoolt). Siinses andmebaasis on niisuguseid keelenimetusi sisse võetud enamasti paratamatusest, sest keelekood on antud just neile, mitte laiemale kooslusele, makrokeelele. Loobutud on Ethnologue’i täpsustavatest täienditest juhul, kui valdavalt tuntakse eri keelekujudest vaid üht: andmebaasis on khmeeri keel (mitte „keskkhmeeri keel“ – vrd Ethnologue’is on ka põhjakhmeeri keel), altai keel (mitte „lõunaaltai keel“, Ethnologue eristab sellest põhjaaltai keelt) jne. (Mõnel juhul on näiteks kohanimeandmebaasi rakendustes üldisem keelekood hakanud tähistama kitsamat keelekuju: chm tähistab niidumari keelt, kuigi Ethnologue’is on „chm“ mari makrokeel, mis koosneb niidumari (mhr) ja mäemari (mrj) keelest, samuti on mn Mongoolia mongoli (halhimongoli) keele tähis, kuigi Ethnologue’is on see jälle makrokeel, mis koosneb halhimongoli (khk) ja nn ääremongoli (sisemongoli, mvf) keelest.)

Murrete nimetamisel on püütud järgida ühtset malli: kui murdenimetus tuleneb kohanimest või hõimunimetusest, siis keele enda nimetust ei ole lisatud, kui see aga sisaldab näiteks ilmakaart märkivat vm kirjeldavat sõna (kesk-, ülem- jts), siis on ette lisatud keelenimetus: mansi idamurded, mansi läänemurded, mari loodemurre jne. See tähendab, et tavakasutuses võib keelenimetus ka puududa (kui keele kontekst on selge), nt idamurded, läänemurded, loodemurre jne. Samahästi võib täiendi teinekord lisada ka keelenimetuse ette: idamansi murded, läänemansi murded, loodemari murre jne. Et kõiki niisuguseid vorme andmebaasis pole, on üksnes seetõttu, et selline vaheldamine on täiesti reeglipärane. (Niisamuti on talitatud vene vastete puhul: kui murdenimetus sisaldab üksnes ilmakaari vm üldisi sõnu, on lisatud keelenimetus – kuigi allikas võib see puududa –, nt западный диалект мокшанского языка = mokša läänemurre.)

Nimetuste mugandamine ja sobitamine

Lähtutud on Emakeele Seltsi keeletoimkonna 1998. a soovitusest, mille järgi kirjutatakse keelte, rahvaste ja hõimude nimetused häälduspärasel kujul. Seekõrval saab aga kasutada nimetusi ka algupärasel kirjakujul, sarnaselt tsitaatsõnadele, st muust tekstist eristatult. Nõnda sobivad võrdselt nii sgoo keel (üks kareni keeli) kui ka sgaw’ keel, anindiljakva keel (Austraalia keeli) ja anindilyakwa keel, hoo keel (khoisani keeli) ja !xóõ keel.

Andmebaasis on püütud võimalikult paljudele keelenimetustele pakkuda mugandatud nimetusi, ent kasutaja võib soovi korral muidugi piirduda algupärase kirjakujuga. Seejuures maksab siiski tähele panna asjaolu, et keelenimetuste rahvusvahelisel standardimisel ei ole leebelt öeldes kaugele jõutud ja keelenimetuste kirjapildis valitseb sageli üsna piisav segadus. Piisab, kui võrrelda keelenimetuste kirjaviisi Ethnologue’is ja näiteks Wikipedias.

Nimetuste häälikulisel mugandamisel on püütud arvestada eesti võõrsõnades väljakujunenud kirjaviisi. Püütud on vältida täishäälikute meelevaldset pikendamist, näitamaks nime rõhku (nt mitte „tukaano“ /hispaania Tucano/, vaid tukano; mitte „trioo“ /portugali Trió/, vaid trio; mitte „mašakalii“ /portugali Maxakalí/, vaid mašakali). Samas, kui lähtekeeles on selgelt pikk täishäälik, siis see on säilitatud, kui paikneb rõhulises silbis (baraamu, datooga, eboo). Rõhk nimetustes on enamasti näidatud esisilbil, kui lähemad andmed lähtekeelse häälduse kohta puuduvad, või kaugemal sõnas, kui seda eeldab silbistruktuur (mask`oi keel, mitte m´askoi või m`ask`oi).

Ühesilbiliste nimetuste mugandamisel on peetud silmas senist tava: kui silbis ühtegi häälikut pikendada ei ole loomulik, siis lisatakse nimetuse lõppu nimetavas käändes i-lõpuline lisasilp, et nimetust oleks ladus kasutada. Nt mitte „šann“ (sellest tuleneks „šanni keel“), vaid šani (rahvaliikmenimetuse ainsuse nimetav) ja šani keel.

Kuigi mugandamisel on püütud järgida kindlaid malle, on see siiski vahel paratamatult ebajärjekindel, kuna kinnistunud mugandeid pole tahetud muuta. Nii on eesti keeles traditsiooniliselt (ilmselt varasema saksa häälduse eeskujul) maoori keel (ootuspärane mugand võiks olla „maaori keel“, vrd Māori). Kahtluste korral sobiva häälduse osas on püütud valida pigem kirjapildilähedane variant.

Paljud lähtenimetused sisaldavad grammatilisi tunnuseid (ees- või järelliiteid), mis teeb nende otsemugandamise eesti keelde keeruliseks. Senisest tavast lähtudes on, kui võimalik, aluseks võetud lähtenime nominatiiv ja see pandud eesti omastava vormi. Nii on adjektiivse keelenimetuse Wymysiöeryś (saksa Wilmesaurisch, ingl Vilamovian või Wilamowicean) mugandamisel aluseks võetud asulanimi Wymysoj ja saadud vimisoi keel. Prantsuse murre poitevin on taandatud kohanimele Poitou ja saadud Poitou murre. Inglise Omotic languages on tõlgitud Omo keelteks (mitte „omootilisteks keelteks“ vms), sest lähteks on Omo jõe nimi. Jne. Kindlasti on siin aga andmete puudumisel veel palju ebajärjekindlust.

Algustäht nimetustes

Emakeele Seltsi keeletoimkonna soovitus näeb ette kirjutada keelte nimetused üldjuhul väikese tähega. Sellest on ka kinni peetud, v.a mõned vähesed erandid, kui keelte nimetamisel on selgelt aluseks võetud mingi kohanimi, nt Coeur d’Alene’i keel (nimetatud reservaadi järgi).

Seevastu murrete ja keelerühmituste nimetamisel tuleb kasutada suurt algustähte, kui aluseks on kohanimi: Altai keelkond, Uurali keelkond, soome keele Peräpohjola murded. Sageli ei ole aga võimalik olnud kindlaks teha, kas on liigitatud kohanimede või hõimunimetuste alusel, seepärast on võimalik, et andmete täpsustamisel nimetuste kirjapilt muutub. Keelerühmituste puhul on püütud suure algustähe põhimõtet võimalikult järjekindlalt rakendada. Paraku toob järjekindel lähenemine teisal kaasa ootamatuid kombinatsioone, nt nahhi-Dagestani keelkond (esimene pool nimetuses viitab nahhi ehk tšetšeeni-inguši hõimudele, teine pool kohanimele Dagestan) või Kesk-Iraani keeled (kesk- on siin ajalises mõttes, st keskperioodi Iraani keeled, samas vrd nt Vana-Kreeka). Teisal sunnib järjekindlus lahku kirjutama seni harjumuspäraseid ühendeid, vrd traditsiooniline obiugri keeled ja uue reegli kohane Obi ugri keeled. Ilmselt on paratamatu, et mõneks ajaks jäävad vähemasti paljud neist rööpselt kasutusele.

PP, 17.11.2009, uuendatud 29.10.2022.

Uude andmebaasi ülekandmine

Uude andmebaasi ülekandmist on kavas teha etappide kaupa, jõudumööda ja lõpptähtaega seadmata. Esmajärjekorras püütakse valmis saada süstemaatiline register, seejärel nimetuste põhivasted (eesti, inglise, prantsuse, saksa, soome ja vene keeles + keele endanimetus) ning kolmandas järgus kõik muu info. Ülekandmise ajal põhjalikke muudatusi kavas teha ei ole, ent muudatused-täiendused on tähistatud °-märgiga. Kui on lisatud uusi keeli vm üksusi, siis need on tähistatud väikese ülaplussiga (⁺).

Lisainfo

Keelekoodi abil on võimalik keele kohta otsida lisainfot:

Koodi ajakohasust saab kontrollida, kopeerides URLi aknasse https://iso639-3.sil.org/code/xxx, milles xxx on asendatud vastava koodiga.
Wikipedia ingliskeelse artikli mingi keele kohta saab kätte ümbersuunava lingiga https://en.wikipedia.org/w/index.php?title=ISO_639:xxx&redirect=yes, milles xxx tuleb samuti asendada vastava koodiga.
Glottologi kogutud teavet keele kohta, sh kaardi keele kõnelejate asukohaga, leiab lingilt http://glottolog.org/glottolog?iso=xxx, milles xxx on asendatud vastava keele koodiga.
Ethnologue’i lühikäsitluse (põhjalikum ülevaade on tasuline) leiab lingilt https://www.ethnologue.com/language/xxx/ (xxx asendada vastava koodiga).

Vt ka

Kirjandus

Anhava 1998 = Jaakko Anhava. Maailman kielet ja kielikunnat. Gaudeamus, Tampere 1998.
Ariste 1967 = P. Ariste. Maailma keeled. I. Euroopa ja Aasia keeled. Õpik Ajaloo-Keeleteaduskonna keeleosakondade üliõpilastele. Tartu 1967.
Ariste 1969 = P. Ariste. Maailma keeled. II. Aafrika keeled. Õpik Ajaloo-Keeleteaduskonna keeleosakondade üliõpilastele. Tartu 1969.
Ariste 1972 – P. Ariste. Maailma keeled. I. Euroopa, Aasia ja Aafrika keeled. Õpik Ajaloo-Keeleteaduskonna keeleosakondade üliõpilastele. Tartu 1972.
Coulmas 1991 = Florian Coulmas. The Writing Systems of the World. Blackwell Publishers. (C) 1989, 1991 (reprinted 1997).
Coulmas 1999 = Florian Coulmas. The Blackwell Encyclopedia of Writing Systems. Blackwell Publishing. (C) 1996, 1999. (4 print 2006).
ESKT 1998 = Rahvaste ja keelte nimetuste õigekiri. Emakeele Seltsi keeletoimkonna soovitus. – Kirjakeele teataja II. 1993–2000. Emakeele Selts 2000, lk 83-105.
Ethnologue, sh
- koodide koondtabel (sisaldab ISO 639-1, -2 ja -3 koode ühes tabelis).
Geonames.de – Werner Fröhlich. Geonames.de. The countries of the world in their local languages and scripts, with official names, capitals, flags, administrative divisions and translations of the country and capital names into many different languages. 2004–.
Glottolog
ISO 639-1
ISO 639-2
ISO 639-3
ISO 639-5
JaDM 1982 = Языки и диалекты мира. Проспект и словник. Москва, “Наука” 1982. (Академия наук СССР. Институт языкознания.)
JaMiBal 2006 = Языки мира. Балтийские языки. Academia, Москва 2006.
JaMiIra 1997 = Языки мира. Иранские языки I. Юго-западные иранские языки. “Индрик”, Москва 1997. // Иранские языки II. Северо-западные иранские языки. “Индрик”, Москва 1999. // Иранские языки III. Восточноиранские языки. “Индрик”, Москва 2000.
JaMiKav 2001 = Языки мира. Кавказские языки. Academia, Москва 2001.
JaMiMon 1997 = Языки мира. Монгольские языки. Тунгусо-маньчжурские языки. Японский язык. Корейский язык. “Индрик”, Москва 1997.
JaMiPal 1997 = Языки мира. Палеоазиатские языки. “Индрик”, Москва 1997.
JaMiTju 1997 = Языки мира. Тюркские языки. “Индрик”, Москва 1997.
JaNSR 1966 = Языки народов СССР. Т. III: Финно-угорские и самодийские языки. Москва 1966.
JaNSR 1967 = Языки народов СССР. Т. IV: Иберийско-кавказские языки. Москва 1967.
JaRo 2002 = Государственные и титульные языки России. Энциклопедический словарь-справочник. Academia, Москва 2002.
Laur 2000 = Mall Laur (koost.). Keelkonnad ja keeled. Koolibri, Tallinn 2000.
Leclerc 1999 = Jacques Leclerc. L’aménagement linguistique dans le monde. Québec, CEFAN, Université Laval 1999–.
LES 1990 = Лингвистический энциклопедический словарь. “Советская энциклопедия”, Москва 1990.
LOW 2009 = Keith Brown, Sarah Ogilvie (Eds.). Concise Encyclopaedia of Languages of the World. (C) Elsevier, 2009.
MRahv 1966 = Maailma rahvastik. Teatmik. Eesti Raamat, Tallinn 1966.
Motz 2007 = Hartmut Motz. Sprachen und Völker der Erde. Linguistisch-ethnographisches Lexikon in 3 Bänden. 1. Auflage. (C) Projekte-Verlag Cornelius GmbH, Halle 2007.
NarodyM 1988 = Народы мира. Историко-этнографический справочник. “Советская энциклопедия”, Москва 1988.
Par pasaules valodu un valodu grupu nosaukumien latviešu valodā. Valsts valodas centra informācija, Rīgā 2006. gada 10. jūlijā. – Latvijas Vēstnesis, 19.07.2006, Nr. 113 (3481).
Soosaar 2007 = Sven-Erik Soosaar. Põhja-Ameerika indiaanlaste nimetused. (Emakeele Seltsi keeletoimkonna koosolekuks 23.05.2007.) Sh kasutusnäited: “Indiaanlased” (2003), “Tomahookide aeg” (1980).
Wikipedia.
WWS 1996 = The World’s Writing Systems. Edited by Peter T. Daniels and William Bright. Oxford University Press, New York & Oxford 1996.

Anna tagasisidet